在這個基礎研究領域,字節默默幹了五年
圖源:Gemini
導讀
有很多企業在做 AI for Science,但大多聚焦於醫藥、材料和大數據等實用方向,而在量子科學這種超硬核基礎研究方向的探索非常難能可貴。
撰文 | 袁嵐峯
● ● ●
如果問近年來最熱的科學領域是什麼,那無疑是人工智能。不過,人工智能最大的用處是什麼呢?
現在的最新趨勢是,科學。
這話的意思是,大家逐漸認識到,最值得用AI去追求的東西就是科學成果,即AI for science,這比用AI聊天有價值得多。聊天聊得再好也不能產生新的知識,而科學是真能改變世界的。從科學到AI,又從AI到科學,閉環了。
有一點大多數人會感到喫驚的是,AI for science這個詞是中國科學家提出來的!不久前,我在跟東方衛視合作的《錨點》節目中訪問北京科學智能研究院理事長張林峯博士時談到,2018年,中國科學院院士鄂維南和湯超等人在北京大學組織了一次會議,這個會議的名稱就是AI for science。
鄂維南院士是著名的應用數學家、我的科大師兄,他在深度學習剛出來的時候就敏銳地意識到,許多領域的困難都可以歸結爲維數災難,而深度神經網絡正是提供了一個克服維數災難的機會,因爲它是一種逼近高維函數的方法。在他的指導下,張林峯等年輕科學家取得了很多突破,例如把高精度分子動力學模擬的原子數一下子提高了五個量級,獲得2020年戈登·貝爾獎,這個獎被稱爲高性能計算應用最高獎。
這方面的研究對我來說其實非常熟悉,因爲我的專業叫做理論與計算化學,分子動力學就是其中的一部分。理論與計算化學還有一部分叫做量子化學,即用量子力學原理直接計算原子分子體系的性質。今天,我們就來介紹一個量子化學的最新進展。
10月21日,來自字節跳動、倫敦國王學院和北京大學等單位的科學家在《Nature Communications》上發表了一篇文章,標題是《一種多分辨率、可系統改進的大規模表面化學計算量子嵌入方案》(A multi-resolution systematically improvable quantum embedding scheme for large-scale surface chemistry calculations)[1]
圖片截取自Nature Communications
實際上,這裏的關鍵是“可系統改進”。量子化學計算最大的好處是算得準,能夠直接跟實驗對照,而最大的困難是計算量隨體系擴大增長得很快,所以對於比較大的體系就算不動了。
量子嵌入就是解決這個困難的一種思路,即把體系分成兩部分,對最感興趣的核心區域用高精度算法,對其他區域用低精度算法,然後想辦法把兩部分的結果縫合起來。比如說我們要研究一個分子吸附在一個表面上,那麼這個分子以及它吸附的那一小塊區域就是最值得關心的,用高精度算法,離得比較遠的地方就不是那麼重要,用低精度算法。
這樣的量子嵌入方案以前就有,但它們不能“系統改進”。這是因爲它們用的高精度算法其實並不是那麼的高精度,例如最常用的密度泛函理論(DFT),其中仍然包括一些經驗參數。它可以快速地得到一個還不錯的結果,但如果真想把誤差縮減到極小,就不知道該怎麼辦了。
這篇文章的突破,就是把量子嵌入中的高精度算法換成了真正意義的高精度,它的誤差確實可以隨着計算參數的提高而下降到極低,這就是“可系統改進”。具體而言,這種算法叫做CCSD(T),意思是包括單重激發(S)、雙重激發(D)和部分三重激發(T)的耦合團簇法(coupled cluster,簡稱CC)。在我二十多年前讀博士的時候,CCSD(T)就是最著名的精確量子化學方法,被廣泛認爲是“金標準”。但它實際用得並不多,爲什麼?因爲計算量太大了,只能處理很小的體系。
那麼,這篇文章的作者是如何迎難而上的?他們的方案叫做SIE,全稱是systematically improvable quantum embedding,即“可系統改進的量子嵌入”。SIE用到很多理論方法,例如施密特分解、密度矩陣嵌入理論、浴自然軌道等等。限於篇幅,在這裏不能詳細介紹。但基本圖景就是,通過這一系列理論創新,加上全面的GPU優化,他們成功地讓很大的體系都能實現CCSD(T)的精度,讓這個金標準適用到了以前不可思議的規模。
具體而言,他們用什麼體系做了演示呢?是一個看起來很簡單、但計算起來一點都不容易的體系:石墨烯上吸附一個水分子。請問,這個水分子最喜歡以什麼樣的構型待在石墨烯上?是兩個氫原子朝下,氧原子朝上(稱爲兩腿)?還是氧原子朝下,兩個氫原子朝上(稱爲零腿)?還是兩腿和零腿之間的某種狀態?
實際上,這個問題以前是衆說紛紜,不同的作者給出不同的結果。這是因爲他們用的算法不同,模型大小也不同。請注意,我們其實沒法模擬一個單個水分子加無窮多個碳原子的體系,我們能模擬的總是有限大小的體系。因此,這就存在一個體系規模收斂性的問題,只有當模型足夠大,我們看到吸附能的計算值收斂了,才能相信結果的可靠性。但以前的計算要不就是模型不夠大,要不就是算法不夠精確,所以沒有一個真正達到收斂的。
在這樣的背景下,我們的SIE立功了。它把碳原子的數目擴展到了384,再加上一定的外推,求出了兩腿和零腿以及其他若干種構型在體系無限大時的吸附能。在外推的過程中發現,水跟石墨烯的相互作用其實是相當長程的,作用距離超過1.8納米,這意味着需要400多個碳原子。無怪乎以前的模擬都不準,因爲它們離這個規模還遠着呢!
SIE既然在高精度下算出了各種構型在體相極限時的吸附能,那就可以比較誰高誰低了。你猜結果是什麼?是各種構型的吸附能都幾乎相等!也就是說,水分子可以在石墨烯上自由翻滾,並不像以前想的那樣傾向於某個構型。
從定性的角度看來,我覺得這個結果其實是相當符合直覺的。因爲石墨烯沒有極性,所以水分子在上面沒有個偏好的角度,這很合理。而在一些極性表面,例如氮化硼或過渡金屬二硫屬化物,水分子就有傾向性了,這同樣也很合理。
但這個計算絕不僅僅是得出了一個符合常理的結果,因爲還有一些現象亟待SIE去解決。例如2022年發現了一種現象叫做量子摩擦,意思是碳納米管內水分子流動受到的摩擦,隨着碳納米管直徑的縮小是會降低,而不是升高。要理解這種現象,顯然直覺就不夠了,需要對很大的體系做十分精確的量子化學計算,這正是SIE有望大顯身手的地方。
這項研究還有一個十分有趣的地方,就是第一單位是字節跳動這個企業。多年來,人們的印象是許多外國企業願意投資做基礎研究,例如貝爾實驗室、IBM、谷歌,而中國企業大多隻願意做應用研究,能立刻賺錢的。但在AI for science的時代,像字節這樣的中國企業在基礎研究方面也大有進步。
實際上,字節跳動的AI for science研究從2021年就開始了。他們的代表性成果,除了這篇SIE,還有一大類是基於神經網絡的量子蒙特卡洛方法(NNQMC)。前面我們說的CCSD(T)和DFT都是確定性算法,而量子蒙特卡洛是一種隨機性算法,天然適合AI應用,所以近年來得到了巨大的關注。
NNQMC最大的好處,就是它算得特別準。有一個重要的指標叫做“化學精度”(chemical accuracy),一般取爲1 kcal/mol,意思是對能量的計算精確到這個程度,就跟實驗相當甚至比實驗更高了。CCSD(T)之所以被稱爲金標準,就是因爲它能系統地達到化學精度。但NNQMC更厲害,字節跳動的科學家發現,隨着神經網絡規模和計算資源的增加,它的精度能夠持續提升,甚至比化學精度還高一個量級。[2][3]
圖片截取自Nature Communications
由此可見,NNQMC有巨大的潛力,唯一的缺點就是算得慢。其實它大部分計算量,都消耗在計算二階導數(即Laplacian)。字節跳動團隊對此設計了一套前向傳播計算框架,叫做Forward Laplacian,使NNQMC達到了十倍加速,從而能處理上百電子的體系[4]。這個框架已經廣泛被業界採用,例如谷歌DeepMind 2024年在《Science》發表的NNQMC工作中,就用到了Forward Laplacian。
圖片截取自Nature Machine Intelligence
還有一個有趣的發展是,NNQMC以前只能計算分子體系,字節跳動團隊把它推廣到了擴展體系。[5]例如大家可能都聽說過魔角石墨烯體系,即兩層轉過特定角度的石墨烯摞在一起,聽說過曹原等人在魔角石墨烯體系中發現了超導性。字節跳動團隊把NNQMC用到了這個體系,從而能夠研究其中的量子霍爾效應和拓撲絕緣體等神奇性質。[6][7][8]
圖片截取自Nature Communications
作爲量子化學專業的,我對這些進展十分感興趣,因爲願意啃這種硬骨頭的太少了。目前可以說有很多企業在做 AI for science,但大多聚焦於醫藥、材料和大數據等實用方向,而在量子科學這種超硬核基礎研究方向的探索非常難能可貴。工欲善其事,必先利其器,在基礎研究方面的突破,必將在將來帶來更大的收穫。
最後,我們來看一下大圖景。AI for science是由中國科學家提出的,中國企業正在把它迅速推向前進。我們期待更多的人和組織對AI for science做出貢獻,把人類文明推到新高度。
作者簡介:
袁嵐峯,中國科學技術大學合肥微尺度物質科學國家研究中心副研究員、科技傳播系副主任、科學傳播研究與發展中心副主任。
參考文獻:
[1] https://www.nature.com/articles/s41467-025-64374-2
[2] https://www.nature.com/articles/s41467-023-37609-3
[3]https://arxiv.org/abs/2508.02570
[4] https://www.nature.com/articles/s42256-024-00794-x
[5] https://www.nature.com/articles/s41467-022-35627-1
[6] https://www.nature.com/articles/s42005-025-02282-z
[7]https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.176503
[8] https://arxiv.org/abs/2503.11756