新華社舊金山2月19日電(記者吳曉凌)美國弧形研究所19日在官網(wǎng)發(fā)布公報說,來自該研究所、美國芯片制造商英偉達公司和美國斯坦福大學(xué)等機構(gòu)的研究人員共同開發(fā)的人工智能(AI)生物學(xué)模型Evo 2當天正式發(fā)布。
公報說,在前一代模型Evo 1的基礎(chǔ)上,Evo 2發(fā)展成為目前生物學(xué)領(lǐng)域規(guī)模最大的AI模型。該模型基于超過12.8萬個基因組數(shù)據(jù)的9.3萬億個核苷酸進行訓(xùn)練。
開發(fā)者表示,Evo 1和Evo 2模型的開發(fā)代表了新興的生成式生物學(xué)領(lǐng)域的關(guān)鍵時刻,因為這些模型使機器能夠“用核苷酸語言來讀、寫和思考”。
據(jù)介紹,Evo 2可用于多種任務(wù),它能夠識別影響蛋白質(zhì)功能和生物體適應(yīng)性的基因變化。例如,在針對與乳腺癌相關(guān)的BRCA1基因變體進行的測試中,Evo 2在預(yù)測哪些突變是良性突變、哪些是潛在致病突變方面達到了90%以上的準確率。這將有助于節(jié)省大量用于細胞或動物實驗的時間和研究資金,通過找到人類疾病的遺傳原因來加速新藥研發(fā)。此外,Evo 2還可用于設(shè)計新的生物工具或治療方法。
公報還強調(diào)說,考慮到潛在的倫理和安全風(fēng)險,研究人員在Evo 2的基礎(chǔ)數(shù)據(jù)集中排除了感染人類和其他復(fù)雜生物的病原體,并確保該模型不會對這些病原體的相關(guān)查詢返回有效答案。
目前,Evo 2已開放給全球科研人員,他們可通過網(wǎng)頁使用該模型,或可免費下載該模型的源代碼、訓(xùn)練數(shù)據(jù)及參數(shù)。相關(guān)研究的預(yù)印本論文于19日發(fā)表在“生物學(xué)預(yù)印本文獻庫”上。