光華講壇——社會(huì)名流與企業(yè)家論壇第6660期
主 題:無(wú)需分布假設(shè)的具有缺失響應(yīng)的聚類(lèi)數(shù)據(jù)預(yù)測(cè)帶
主講人:華東師范大學(xué) 唐炎林教授
主持人:統(tǒng)計(jì)學(xué)院 林華珍教授
時(shí)間:11月17日 14:00-15:00
舉辦地點(diǎn):柳林校區(qū)弘遠(yuǎn)樓408會(huì)議室
主辦單位:統(tǒng)計(jì)研究中心和統(tǒng)計(jì)學(xué)院 科研處
主講人簡(jiǎn)介:
唐炎林,華東師范大學(xué)統(tǒng)計(jì)學(xué)院教授,博士生導(dǎo)師,統(tǒng)計(jì)學(xué)系主任;入選國(guó)家高層次青年人才計(jì)劃(組織部)。2012年1月博士畢業(yè)于復(fù)旦大學(xué)統(tǒng)計(jì)系,同年5月加入同濟(jì)大學(xué),2019年1月加入華東師范大學(xué)。主要研究方向?yàn)榉治粩?shù)回歸、高維統(tǒng)計(jì)推斷、不完全數(shù)據(jù)統(tǒng)計(jì)建模,主持多項(xiàng)國(guó)家自然科學(xué)基金、上海市自然科學(xué)基金,擔(dān)任SCI期刊Statistica Sinica、Journal of the Korean Statistical Society的編委。在Biometrika、JRSSB、PNAS、Biometrics等發(fā)表論文30余篇。
內(nèi)容簡(jiǎn)介:
現(xiàn)有的缺失聚類(lèi)數(shù)據(jù)的方法往往依賴(lài)于強(qiáng)模型假設(shè),因此容易出現(xiàn)模型錯(cuò)配。主講人基于共形推斷為新個(gè)體的整個(gè)軌跡構(gòu)建預(yù)測(cè)帶,在有限樣本中產(chǎn)生具有收斂性保證的依賴(lài)于協(xié)變量的預(yù)測(cè)帶,而不需要對(duì)模型設(shè)置和類(lèi)別內(nèi)部相依性結(jié)構(gòu)進(jìn)行任何假設(shè)。首先通過(guò)下采樣將聚類(lèi)數(shù)據(jù)分解為獨(dú)立的截面數(shù)據(jù),然后提出三種加權(quán)共形方法來(lái)生成預(yù)測(cè)區(qū)域。為了利用聚類(lèi)數(shù)據(jù)的相關(guān)信息,主講人重復(fù)子抽樣和共形推斷,通過(guò)組合相關(guān)的p值來(lái)產(chǎn)生一個(gè)集成的預(yù)測(cè)區(qū)域。在三種方法中,加權(quán)CD分割方法通過(guò)收斂到最高密度集合產(chǎn)生最小的預(yù)測(cè)區(qū)域,并為每個(gè)給定個(gè)體提供漸近條件收斂性保證。模擬結(jié)果表明,與其他方法相比,主講人的方法在不同復(fù)雜誤差分布下都具有良好的有限樣本表現(xiàn)。在激勵(lì)這項(xiàng)研究的血清膽固醇數(shù)據(jù)和CD4+細(xì)胞數(shù)據(jù)集上展示了該方法的實(shí)際應(yīng)用。