主題:適用于復(fù)雜結(jié)構(gòu)表型的全基因組關(guān)聯(lián)分析算法
主講人:北京大學(xué)基礎(chǔ)醫(yī)學(xué)院 畢文健教授
主持人:統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院 林華珍教授
時(shí)間:5月22日16:00-17:00
地點(diǎn):柳林校區(qū)弘遠(yuǎn)樓408會(huì)議室
主辦單位:統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院 科研處
主講人簡(jiǎn)介:
畢文健,北京大學(xué)基礎(chǔ)醫(yī)學(xué)院醫(yī)學(xué)遺傳學(xué)系課題組長(zhǎng),研究員,北京大學(xué)博雅青年學(xué)者,國(guó)家級(jí)人才計(jì)劃入選者。主要工作涉及統(tǒng)計(jì)遺傳學(xué)、生物統(tǒng)計(jì)與系統(tǒng)生物學(xué)、生物信息學(xué)等,針對(duì)基因-環(huán)境交互作用、生存數(shù)據(jù)和多分類(lèi)表型數(shù)據(jù)設(shè)計(jì)了多種快速、準(zhǔn)確的分析算法,并應(yīng)用于UK Biobank等大型生物樣本庫(kù)的實(shí)際數(shù)據(jù)中。以第一/通訊作者身份發(fā)表于Nature Genetics (2022)、American Journal of Human Genetics (2019, 2020, 2021, 2023)、Nature Communications (2025a, 2025b, 2025c)、PLOS Genetics (2024)、Cell Reports Medicine (2025)、Genetics、Biostatistics等學(xué)術(shù)雜志。主持國(guó)家自然科學(xué)基金專(zhuān)項(xiàng)項(xiàng)目、面上項(xiàng)目、國(guó)際合作和交流項(xiàng)目,北京市自然科學(xué)基金非共識(shí)創(chuàng)新項(xiàng)目等。
內(nèi)容提要:
隨著全球大型生物樣本庫(kù)(biobank)數(shù)據(jù)的興起,人們開(kāi)始在大規(guī)模全基因組關(guān)聯(lián)研究(GWAS)中關(guān)注結(jié)構(gòu)更為復(fù)雜的性狀。例如,生存時(shí)間(time-to-event)和縱向(longitudinal)數(shù)據(jù)能夠更全面刻畫(huà)個(gè)體健康狀況的演變過(guò)程,相比于傳統(tǒng)的定量或二元性狀蘊(yùn)含更多信息?;仡櫺躁P(guān)聯(lián)方法(retrospective association methods)以表型為條件、將基因型視為隨機(jī)變量,從而為大規(guī)模遺傳關(guān)聯(lián)研究提供了可擴(kuò)展、精準(zhǔn)且通用的分析框架?;谶@類(lèi)分析框架,我們提出了多種適用于復(fù)雜表型的大規(guī)模 GWAS 通用方法。SPAmix:通過(guò)利用原始基因型數(shù)據(jù)及 SNP 派生的主成分(PCs),為每個(gè)變異估計(jì)個(gè)體層面的等位基因頻率,從而處理群體混合(population admixture)問(wèn)題。SPAGRM:借助稀疏遺傳關(guān)系矩陣(sparse GRM)和同源片段(IBD)信息,校正得分統(tǒng)計(jì)中的隱含遺傳相關(guān)性,以調(diào)整樣本親緣關(guān)系的影響。SPAGxE:利用矩陣投影方法去除基因-環(huán)境交互作用分析中的遺傳邊際效應(yīng)。我們?cè)谀M研究和英國(guó)生物樣本庫(kù)(UK Biobank)真實(shí)數(shù)據(jù)分析中驗(yàn)證了 各類(lèi)方法 的性能。結(jié)果表明,這兩種方法在保持較高統(tǒng)計(jì)功效的同時(shí),能夠嚴(yán)格控制第一類(lèi)錯(cuò)誤率,這些特點(diǎn)有助于實(shí)際數(shù)據(jù)分析找到更多的致病遺傳位點(diǎn)。