國際最新研發(fā)深度學(xué)習(xí)模型:可預(yù)測DNA變異影響助力開發(fā)新療法
中新網(wǎng)北京1月30日電 (記者 孫自法)國際學(xué)術(shù)期刊《自然》最新發(fā)表一篇基因組學(xué)論文稱,谷歌研究團隊研發(fā)的一款深度學(xué)習(xí)模型AlphaGenome,能預(yù)測長達100萬堿基對的DNA序列的功能。
研究團隊認為,基于能預(yù)測DNA序列變異如何影響不同生物過程,AlphaGenome可用于理解遺傳疾病、改進基因檢測,并為開發(fā)新療法提供信息。

該論文介紹,基因變異會影響生物學(xué)過程并可能引發(fā)疾病,但理解DNA序列變化如何影響其功能是個難題。大多數(shù)變化(約98%)發(fā)生于非編碼區(qū)域(不編碼蛋白質(zhì)但影響基因表達的DNA區(qū)域),使得預(yù)測其影響變得困難。要解決這一問題需要計算模型,現(xiàn)有的方法在序列長度和預(yù)測強度上必須做出取舍,但AlphaGenome能在長DNA序列中做出高分辨率預(yù)測。
在本項研究中,谷歌DeepMind團隊展示了AlphaGenome的能力,這一深度學(xué)習(xí)模型用人類和小鼠基因組訓(xùn)練來學(xué)習(xí)DNA序列如何影響不同生物學(xué)過程。AlphaGenome可以即時預(yù)測5930種人類或1128種小鼠遺傳信號,這些信號與特定功能有關(guān),如基因表達、剪接(基因組的切割與重組)和蛋白質(zhì)修飾。在26項變異效果預(yù)測評估中,其結(jié)果在25項中與現(xiàn)有頂尖模型表現(xiàn)相當或更優(yōu)。因此,該模型優(yōu)勢在于能同時對多種遺傳信號和生物學(xué)結(jié)果進行多重預(yù)測。
研究團隊總結(jié)表示,進一步改進這一工具或能拓展其應(yīng)用,例如增加涵蓋的物種,或拓展模型能識別的非編碼序列范圍。未來,AlphaGenome有望深化對DNA序列變異引發(fā)的復(fù)雜生物學(xué)結(jié)果的理解。(完)



































京公網(wǎng)安備 11010202009201號