今天小編分享的科學經驗:AI蛋白質諾獎後再登Nature,第一性原理級精度,微軟亞研院4年之作,歡迎閲讀。
歷時四年,微軟亞研院 AI for Science 團隊發布 AI 驅動的從頭算(ab initio)生物分子動力學模拟系統。
直接登上 Nature 正刊。
系統名為AI ² BMD,能夠高效模拟含有 10000 多個原子的各種蛋白質,分辨率達到全原子級别,近似達到從頭算(第一性原理)的精确度。
且比量子力學方法中的密度泛函理論(DFT)能實現的速度快幾個數量級。
AI ² BMD 的出現,可促進藥物發現、蛋白質設計和酶工程等領網域的新生物醫學研究。
微軟研究院院長 Peter Lee 親自發帖子為自家研究做宣傳:
網友們紛紛表示這項研究十分令人着迷,可能會對一些領網域產生颠覆性的影響:
可能會徹底改變我們對生物學和藥物發現的認知。
生物分子動力學模拟系統,AI ² BMD
為便于大家理解,作者們還自撰了一篇 Blog,量子位在不改變原意的基礎上進行了編譯整理,一起來康康 AI ² BMD 到底長啥樣。
在介紹 AI ² BMD 之前,先來簡單了解一下分子動力學模拟。
生物世界的本質在于其分子及其相互作用的不斷變化。理解生物分子的動态和相互作用對于破譯生物過程背後的機制以及開發生物材料和藥物至關重要。然而通過實驗幾乎不可能捕捉這些現實生活中的運動。
此前,AlphaFold、RoseTTAFold 等為代表的深度學習方法,已經實現了用實驗精度預測靜态晶體蛋白結構。
不過精确地在原子分辨率下表征動态仍然是一項非常具有挑戰性的任務,特别是當蛋白質發揮作用并與其它生物分子或藥物分子相互作用時。
分子動力學(MD)模拟方法将物理學定律與數值模拟相結合,用于探索分子運動與其生物功能之間的關系,已經被廣泛使用了幾十年。
分子動力學模拟大致可以分為兩類:經典分子動力學和量子力學。
經典版本在 2013 年獲得諾貝爾獎,強調了其在推動人類理解復雜生物系統方面的關鍵作用。
量子力學方法中的密度泛函理論(DFT)在 1998 年獲得諾貝爾獎,标志着計算化學的一個關鍵時刻。
不過,經典分子動力學采用分子系統的簡化表示,實現長時間構象變化的快速模拟速度,但準确性較低。相比之下,像密度泛函理論這樣的量子力學模型提供了自下而上的計算,但對于大生物分子來説,計算成本過高。
由此,微軟研究院開發出了基于 AI 的從頭算生物分子動力學系統—— AI ² BMD,這也是團隊四年研究成果的結晶。
AI ² BMD 能夠高效地以全原子分辨率模拟包含超過 10000 個原子的各類蛋白質,達到近似從頭計算(第一性原理)的精度。
相比标準模拟技術,它在生物分子模拟方面實現了前所未有的權衡:獲得比經典模拟更高的精度,其計算成本雖然高于經典模拟,但比密度泛函理論(DFT)快幾個數量級。
AI ² BMD 采用專門設計的通用蛋白質分片方法,将蛋白質分割成重疊的單元,創建了 2000 萬個快照的數據集,這也是迄今為止 DFT 層面最大的數據集。
基于團隊先前設計的通用分子幾何建模基礎模型ViSNet,團隊用機器學習訓練了 AI ² BMD 的勢能函數。然後通過高效的 AI ² BMD 模拟系統進行模拟,在每一步中基于 ViSNet 的 AI ² BMD 勢能都會以從頭計算的精度計算蛋白質的能量和原子力。
通過動力學和熱力學的全面分析,AI ² BMD 與實驗室數據表現出更好的一致性,例如在蛋白質的折疊自由能和不同現象方面,比經典分子動力學表現更好。
總結來説,AI ² BMD 在分子動力學模拟領網域取得了以下幾個方面的重大突破:
從頭計算精度:
引入了一種可泛化的 " 機器學習力場 ",這是一種學習原子與分子間相互作用的模型,用于具有從頭算精度的全原子蛋白質動力學模拟。
解決泛化問題:
它是首個解決機器學習力場在模拟蛋白質動力學中的泛化挑戰的方法,展示了對多種蛋白質進行穩健地從頭算分子動力學模拟。
通用兼容性:
AI ² BMD 将量子力學建模從小的局部區網域擴展到整個蛋白質,而且不需要對蛋白質有任何先驗知識。這消除了量子力學與蛋白質的分子力學計算之間可能的不兼容性,并将量子力學區網域的計算速度提高了幾個數量級,使全原子蛋白質接近從頭算計算成為現實。因此,AI ² BMD 為眾多下遊應用鋪平了道路,提供了表征復雜生物分子動力學的新視角。
速度優勢:
AI ² BMD 比 x 和其它量子力學方法快幾個數量級。支持對超過 10000 個原子的蛋白質進行從頭計算,使其成為跨學科領網域中最快的 AI 驅動的分子動力學模拟程式之一。
多樣構象空間探索:
對于 AI ² BMD 和蛋白質分子力學模拟的蛋白質折疊和解折疊過程,AI ² BMD 能夠探索更多蛋白質分子力學無法檢測到的可能構象空間。
因此,AI ² BMD 為研究藥物 - 靶标結合過程、酶催化、變構調節、内源性無序蛋白等過程中的蛋白質柔性運動提供了更多機會,與濕實驗更好地吻合,為生物機制檢測和藥物發現提供更全面的解釋和指導。
實驗一致性:
AI ² BMD 超越了量子力學 / 蛋白質分子力學混合方法,并在不同的生物應用場景中展示了與濕實驗室實驗的高度一致性,包括 J 耦合、焓、熱容、折疊自由能、熔點和 pKa 計算。
作者簡介
這項研究共同一作有四位 Tong Wang、Xinheng He、Mingyu Li、Yatao Li,由 Tong Wang、Bin Shao 共同指導。
Tong Wang
Tong Wang 是微軟研究院 AI4Science 高級研究員。他在清華大學獲得博士學位,并在哈佛大學有訪問學者經歷。
他的研究重點是分子動力學模拟、量子模拟、計算機輔助藥物發現和蛋白質結構預測的算法設計與應用。
Tong Wang 博士以第一作者和通訊作者身份發表了一系列研究,刊登在 Nature Machine Intelligence、Nature Communications、Cell Research 等期刊上,并擁有多項專利。他還是 Nature 系列期刊的審稿人以及 ACS 出版品的榮譽審稿人。
作為團隊負責人,他在首屆全球 AI 藥物開發大賽中獲得冠軍,并在 NIPS2022 的 OGB 大規模挑戰賽中獲勝。
邵斌(Bin Shao)
邵斌是微軟研究院 AI4Science 資深高級研究經理,于 2010 年 7 月在復旦大學獲得博士學位後加入微軟。
他的研究興趣包括蛋白質動力學模拟、計算生物學、機器學習和分布式計算,研究成果已發表在多個頂會和期刊上。
由邵斌團隊開發的 Microsoft Graph Engine 正在為微軟的多個產品和服務提供支持,如微軟 Satori 知識圖譜、必應搜索、MSN、Xbox 和認知服務等。邵斌還是開源輕量級 AIMD 模拟程式 LightAIMD 的發起人和主要開發者。
參考鏈接:
[ 1 ] https://www.nature.com/articles/s41586-024-08127-z
[ 2 ] https://x.com/peteratmsr/status/1854199356850889096
[ 3 ] https://www.binshao.info/
[ 4 ] https://www.microsoft.com/en-us/research/people/watong/