谷歌Alpha再衝諾獎?“秒解”基因暗物質,照亮人類疾病“黑箱”

來源: 更新:

繼Alphafold(阿爾法摺疊)之後,谷歌DeepMind團隊Alpha系列重磅上新。1月29日,基因解碼AI模型AlphaGenome(阿爾法基因組)登上國際頂刊《自然》封面——它不僅爲人類“生命天書”配上了一臺“實時編譯模擬器”,更以極高精度和極寬視野爲生命科學研究打開一扇觀察遺傳調控全貌的新窗口。

6年前,谷歌團隊推出蛋白質預測AI模型AlphaFold,解決了困擾科學家50多年的難題,即蛋白質如何摺疊,並於2024年獲得諾貝爾化學獎。如今,AlphaGenome再次震撼世界——能破解佔據基因組98%的“暗物質”區域,讀懂與人類健康和疾病息息相關的“垃圾DNA”。

對此,諾獎得主、DeepMind掌門人德米斯·哈薩比斯樂觀表示:“未來十年,AI將治癒所有疾病。”業界普遍認爲,展現出解碼基因“超能力”的AlphaGenome可能重構生命科學研究範式,爲罕見病診斷、癌症機理研究、基因療法設計乃至合成生物學,提供一個統一的、可解釋的智能分析框架。

長距離+高精度,解碼基因“暗物質”

本世紀初,人類基因組計劃讓我們初窺了DNA這本“生命天書”的全貌。科學家發現,在人類基因組中,僅有2%編碼蛋白質,其餘98%的非編碼區域雖不直接產生蛋白質,卻是精確掌控基因的“調控區”——這片區域被稱爲基因“暗物質”。

上海市生物醫藥技術研究院研究員黃薇解釋,人類基因組序列變異的致病性,很大一部分表現在基因的“調控區”,但“調控區”的作用範疇可能涵蓋幾萬、幾十萬個鹼基,“以往我們在基因組序列中會看到很多變異,但無法確定它們的作用,如果能在一個更大視野中研究其相互作用,即可幫助判斷其致病性,現在一個理想工具似乎呈現在我們面前”。

AlphaGenome創新性地破解了“基因暗物質困境”:既能一次性“讀取”百萬個鹼基對,預測精度可精確定位到單個鹼基,還能“一攬子”模擬基因表達、剪接、染色質狀態、蛋白質結合等複雜生物過程——相當於爲基因組研究開啓了一個高清全景模式。

最終,AlphaGenome能同時輸出超過11類、數千種具體的基因組功能預測,幾秒鐘內交出一份基因組“綜合體檢報告”,內容涵蓋基因表達量、剪接模式、染色質三維結構等。“這樣的工作在過去往往需要實驗室的數年努力。”黃薇認爲,AlphaGenome將給基因組研究帶來一場範式變革。

在這篇論文中,DeepMind團隊用基因TAL1開展了一次“實戰演習”。TAL1在正常血液發育中不可或缺,當它被錯誤表達時,會引發T細胞白血病。AlphaGenome準確預測出了激活錯誤表達的具體路徑,且與之前的結論完全吻合。

在26項權威評測中,AlphaGenome在25項取得領先,其中對疾病相關非編碼變異的發現能力比前代最佳模型提升一倍以上。

不計短期回報,專注基礎科學難題

其實,早在去年6月,谷歌團隊就將AlphaGenome投到了預印本平臺bioRxiv上,當時就引起業界極大關注。

在分享研究背後的故事時,團隊成員提到,他們的初衷是想預測遺傳變異的功能影響——希望AI能最終編譯DNA序列這一“生命源代碼”,這對人類健康和罕見病診斷具有重要意義。

從TAL1的實驗可以看出,AlphaGenome將DNA序列變化與細胞層面的分子機制變化連接起來,讓非編碼區的功能影響也能被系統預測。當以往需要大量實驗試錯的“盲猜”過程,變成了可模擬、可推理的“代碼調試”,人類疾病“黑箱”將被照亮,生物醫藥研發管線也將隨之重構。

從Alphago到Alphafold再到AlphaGenome,Alpha系列的每一次上新都伴隨着革命性影響。在上海人工智能實驗室研究員、上海創智學院導師董楠卿看來,這延續了DeepMind獨特的科研路徑:不計短期商業回報,專注攻克基礎科學“硬骨頭”——這種堅持殊爲可貴。

“從技術角度看,AlphaGenome更多的是工程創新,但研發出這樣一個基因組大模型,難度不亞於開發一個傳統大模型。”董楠卿解釋,通過AI實現百萬級序列的超長單鹼基高精度預測不僅需要大量高質量數據和充沛算力,相較於DeepSeek等通用大模型領域的熱火朝天,基礎學科大模型領域存在大量技術路徑空白,“沒人能打包票一定能做出”。

AI驅動科學發現,新範式加速到來

AlphaGenome是否會讓谷歌團隊再次捧得諾獎?董楠卿認爲,它有一定潛質,比如正在解決重大基礎科學問題、提供了革命性的研究工具,還在疾病機理研究中展現出一定的顛覆性能力,“但要達到如AlphaFold一般的影響力,仍需完成不少關鍵挑戰”。

最重要的一個挑戰是物種泛化。目前,AlphaGenome的訓練主要基於人類和小鼠數據。董楠卿表示,在生命科學領域,人和小鼠只是哺乳動物中的兩個物種,除了動物,還有植物、微生物,相比之下,它們的DNA註釋數據更加稀少,模型訓練的難度更高。

然而,相對於進化更完全的人類,植物基因組有着許多特殊調控現象。董楠卿認爲,若將模型能力拓展至植物和微生物領域,一方面更接近於揭示生命通用調控法則,另一方面對人類社會的生存發展同樣具有重大意義。

AlphaGenome的誕生不是終點,而是新起點:以AI驅動的基礎科學發現新時代正加速到來。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top