光華講壇——社會(huì)名流與企業(yè)家論壇第6628期
主題:Automated Feature Engineering: Bridging the Gap between Feature Engineering and Self-optimization自動(dòng)化特征工程:填補(bǔ)特征工程與自?xún)?yōu)化之間的空白
主講人:波特蘭州立大學(xué)助理教授 劉鯤鵬
主持人:西南財(cái)經(jīng)大學(xué) 黃雁勇教授
時(shí) 間:11月9日 15:00-16:00
舉辦地點(diǎn):柳林校區(qū)誠(chéng)正樓統(tǒng)計(jì)學(xué)院會(huì)議室
主辦單位:數(shù)據(jù)科學(xué)與商業(yè)智能聯(lián)合實(shí)驗(yàn)室 統(tǒng)計(jì)學(xué)院 科研處
主講人簡(jiǎn)介:
劉鯤鵬是波特蘭州立大學(xué)計(jì)算機(jī)系助理教授,研究興趣為數(shù)據(jù)挖掘與強(qiáng)化學(xué)習(xí)。他最近的研究方向集中在自動(dòng)化數(shù)據(jù)科學(xué)系統(tǒng)及其在大數(shù)據(jù)問(wèn)題上的應(yīng)用,包括智能城市、機(jī)器學(xué)習(xí)隱私保護(hù)、可解釋的推薦系統(tǒng)、用戶(hù)行為分析。他的研究成果發(fā)表在KDD、TKDE、IJCAI、AAAI、WWW等各個(gè)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)的頂級(jí)會(huì)議、期刊上。多次擔(dān)任IJCAI高級(jí)程序委員會(huì)委員,并且在KDD、ICML、ICLR、NeurIPS、AAAI、WWW、CIKM、ICDM等國(guó)際頂級(jí)會(huì)議中常態(tài)化擔(dān)任程序委員會(huì)委員。
內(nèi)容簡(jiǎn)介:
In recent years, data mining has achieved great success in enormous scenarios. As the foundation of data mining, feature engineering plays an essential role in comprehending and perceiving data. Successful feature engineering can remove irrelevant features, generate informative features, improve model performance, enhance generalization, and provide better interpretation and explanation. However, not all researchers and practitioners are experts in feature engineering, making the automation of feature engineering an indispensable demand. In this talk, I will first introduce what feature engineering is and why it is difficult to automate the feature engineering process. Then, I will focus on (1) automated feature selection (2) automated feature generation. Finally, I will conclude the talk and present the big picture of developing intelligent, interpretable, and interactive automated data science systems.
近年來(lái),數(shù)據(jù)挖掘已經(jīng)在許多應(yīng)用場(chǎng)景中取得了巨大的成功。作為數(shù)據(jù)挖掘的基礎(chǔ)技術(shù),特征工程在理解與感知數(shù)據(jù)的過(guò)程中有著不可替代的作用。理想的特征工程可以移除無(wú)關(guān)特征、生成信息量大的特征、提高模型表現(xiàn)、提高泛化性、提供更好的理解力和可解釋性。但是,在諸多的應(yīng)用場(chǎng)景中,大多數(shù)從業(yè)者并不是特征工程的專(zhuān)家,因此,自動(dòng)化特征工程以降低特征工程的使用門(mén)檻,成為一個(gè)不可忽視的需求。在本次報(bào)告中,我將首先介紹自動(dòng)化特征工程的重要性及其挑戰(zhàn)性,并著重闡述:1.自動(dòng)化特征選擇;2.自動(dòng)化特征生成。最后,我將展望未來(lái)的智能化、可理解、可交互的自動(dòng)化數(shù)據(jù)科學(xué)系統(tǒng)并提出若干發(fā)展方向。