基因網(wǎng)絡(luò)繪制需要大量轉(zhuǎn)錄組數(shù)據(jù)用于建立基因之間的聯(lián)系,這也阻礙了一些數(shù)據(jù)有限場景(如罕見?。┑妊芯?。最近,利用遷移學習的機器學習技術(shù)在自然語言和計算機視覺等領(lǐng)域帶來了變革性進展,其通過在大規(guī)模通用數(shù)據(jù)集上進行大模型預(yù)訓(xùn)練,而后遷移到數(shù)據(jù)量有限的特定任務(wù)進行微調(diào)。美國博德研究所等研究團隊提出了一個深度學習模型Geneformer可實現(xiàn)特定生物學任務(wù)與背景中的預(yù)測。該研究成果于近日發(fā)表在《Nature》雜志上,題為:Transfer learning enables predictions in network biology。
研究人員開發(fā)的深度學習模型Geneformer,在大約3000萬個單細胞轉(zhuǎn)錄組的大規(guī)模數(shù)據(jù)集上進行了預(yù)訓(xùn)練,以便在網(wǎng)絡(luò)生物學有限數(shù)據(jù)的情況下進行特異性預(yù)測。在預(yù)訓(xùn)練期間,Geneformer獲得了對網(wǎng)絡(luò)動態(tài)的基本理解,以完全自我監(jiān)督的方式在模型的注意力權(quán)重中編碼網(wǎng)絡(luò)層次。研究人員利用Geneformer基于下游有限數(shù)據(jù)進行了預(yù)測任務(wù),包括“疾病候選靶點預(yù)測”“解釋拷貝數(shù)變異”“關(guān)鍵基因網(wǎng)絡(luò)調(diào)控因子”“基因網(wǎng)絡(luò)層次編碼”“染色質(zhì)動力學預(yù)測”等,并通過實驗支持了其預(yù)測的結(jié)果。
綜上,Geneformer代表了一種預(yù)訓(xùn)練的深度學習模型,可以對其進行微調(diào),以實現(xiàn)廣泛的下游應(yīng)用,加速發(fā)現(xiàn)網(wǎng)絡(luò)調(diào)節(jié)關(guān)鍵環(huán)節(jié)和候選治療目標。
注:此研究成果摘自《Nature》雜志,文章內(nèi)容不代表本網(wǎng)站觀點和立場,僅供參考。
知前沿,問智研。智研咨詢是中國一流產(chǎn)業(yè)咨詢機構(gòu),十數(shù)年持續(xù)深耕產(chǎn)業(yè)研究領(lǐng)域,提供深度產(chǎn)業(yè)研究報告、商業(yè)計劃書、可行性研究報告及定制服務(wù)等一站式產(chǎn)業(yè)咨詢服務(wù)。專業(yè)的角度、品質(zhì)化的服務(wù)、敏銳的市場洞察力,專注于提供完善的產(chǎn)業(yè)解決方案,為您的投資決策賦能。



