今天小編分享的科學經驗:AI蛋白質設計前沿教程,AAAI‘25三大機構攜手4小時全面剖析,歡迎閲讀。
精準預測和設計蛋白質的序列、結構及模拟其動态變化,一直是科學界的重大挑戰。
在即将舉行的 AAAI 2025 會議上,加拿大魁北克省人工智能研究所 Mila、美國東北大學和 MIT 的學者将組織一場主題為 " 人工智能在蛋白質設計中的應用 " 的教程。
(文末附教程直通車)
綜觀當下,AI 與生命科學深度融合背景下,蛋白質研究正經歷前所未有的 AI 驅動變革。
作為生命活動的核心,蛋白質在細胞結構構建、物質運輸和催化化學反應中扮演着關鍵角色。如今,AI 技術的介入,以前所未有的速度和力度,重塑了蛋白質研究的格局,帶來了無限可能。
這不僅加速了新藥研發和生物技術創新,也為解決環境和工業領網域的挑戰提供了新的工具。
本次教程将全面回顧 AI 在蛋白質預測與設計領網域的最新進展,探讨當前的研究成果和未來的發展方向。
同時,教程将展望 AI 在蛋白質設計中的未來趨勢,讨論可能面臨的挑戰和機遇。
無論是蛋白質序列表示學習,還是結構研究,AI 都展現出巨大潛力。
本次教程中,主辦方将詳細介紹 AI 在蛋白質序列、結構和功能預測與設計中的應用方法。通過生成模型進行蛋白質設計,甚至可以創造具有特定功能的新型蛋白質。
教程希望參與者具備機器學習的基礎知識,但即使缺乏計算生物學或生物信息學經驗也無妨,課程将提供入門介紹,幫助大家了解這一交叉學科領網域。
教程定于美東時間 2 月 26 日上午 8:30 至中午 12:30 在賓夕法尼亞州費城會議中心 117 号房間舉行。
教程大綱:多維度解鎖蛋白質設計奧秘
本次教程将從多個維度深入解析 AI 蛋白質設計領網域的關鍵問題、前沿方法和研究趨勢,具體内容如下:
(一)序章:前沿洞察與基礎知識
本部分将重點介紹 AI 在蛋白質研究領網域取得的重大突破。
從早期探索到最新成果,AI 在蛋白質研究中的每一步進展都意義深遠。
同時,将對蛋白質的基本結構、功能及其在生命活動中的重要角色進行科普講解。
最後,讨論如何對蛋白質數據進行學習,為後續深入研究奠定堅實基礎。
(二)蛋白質表示學習:挖掘數據的潛在價值
本部分是教程的核心之一,将詳細介紹多種蛋白質表示學習的方法。
在序列表示學習中,将深入探讨自回歸語言模型、掩碼語言模型和擴散語言模型,這些模型以不同方式對蛋白質序列進行編碼,提取關鍵信息。
結構表示學習方面,幾何深度學習為研究蛋白質的幾何結構提供了新視角;GVP、GearNet 等蛋白質結構編碼器,以及多種結構預訓練算法,從不同角度對蛋白質結構進行學習和優化。
多模态表示學習結合了序列、結構、功能和文本等多種信息,模型如 ESM-GearNet、SaProt、DPLM-2、ESM3、ProtST 等,展示了多模态融合在蛋白質研究中的強大能力。
最後,将介紹這些方法在蛋白質理解任務、蛋白質适應性預測和抗體親和力優化等方面的應用。
(三)蛋白質結構和動力學預測,探索分子動态奧秘
蛋白質結構和動态預測是研究中的核心問題之一。
本部分将介紹單鏈折疊(如 AlphaFold2、ESMFold)、側鏈預測(如 AttnPacker、DiffPack)和復合物預測(如 AlphaFold-Multimer、AlphaFold3)等前沿方法。
在蛋白質構象采樣方面,與會人員将探讨玻爾茲曼生成器、基于粗粒度的方法、基于剛性框架的方法以及蛋白質結構語言模型。
在分子動力學(MD)軌迹模拟中,将介紹神經模拟器、條件轉移算子和軌迹生成器等前沿方法。
(四) 蛋白質設計:開啓新型蛋白質創造之門
在序列設計方面,主辦方将介紹無條件序列生成(如 ProGen)和逆折疊(如 ESM-IF、ProteinMPNN)的方法。
結構設計中,FrameDiff、FrameFlow、Genie2、Chroma、RFDiffusion、FoldFlow、FoldFlow-2 等模型将是讨論的重點。
序列 - 結構協同設計部分,ProtSeed、ProteinGenerator、MultiFlow、Protpardelle、DPLM-2 等模型将展示如何同時優化蛋白質的序列和結構。
抗體設計将聚焦于 RefineGNN、AbX 等方法。
(五)總結與展望:共繪蛋白質設計的未來藍圖
這一部分将系統回顧整個教程的核心内容,梳理人工智能在蛋白質設計領網域的最新進展與取得的成果。
此外,主辦方還将對該領網域未來可能的發展趨勢進行展望,深入探讨前沿研究中可能遇到的挑戰及潛在的機遇。
最後,教程特别設定了互動問答環節,以進一步增進交流、啓發思考,共同探索蛋白質設計研究的新方向。
教程背後組織團隊
本次教程由加拿大 Mila 教授唐建,和美國東北大學教授金汶功團隊聯合組織。
唐建博士是加拿大魁北克省人工智能研究中心 Mila 副教授,該中心由圖靈獎得主、"AI 之父 " Yoshua Bengio 創立。
他還是加拿大 CIFAR AI 講席教授、北京百奧幾何公司創始人兼首席執行官。
此外,唐建是圖表示學習領網域的知名學者,在深度生成模型、圖機器學習及其藥物發現應用方面成果顯著。
他曾發表圖表示學習領網域的經典論文 LINE(單篇引用次數超過 6000 次),并将這些技術開創性地應用于藥物發現領網域,發表了一系列極具影響力的代表作,包括最早用于分子圖的預訓練算法 InfoGraph、第一個用于分子三維結構生成的擴散生成模型 ConfGF 和 GeoDiff,以及最早基于蛋白質三維結構的預訓練模型之一 GearNet。
他還與英偉達、Intel、IBM 等機構共同開發了業内首個專門針對藥物與蛋白質的開源機器學習平台 TorchDrug 和 TorchProtein。相關研究發表于 Nature、PNAS、Nature Communications、Nature Machine Intelligence、NeurIPS、ICML、ICLR 等頂級會議與期刊。
同時,唐建還擔任 NeurIPS 和 ICML 的領網域主席,以及機器學習領網域著名期刊 Journal of Machine Learning Research ( JMLR ) 的執行編輯。
金汶功博士是美國東北大學 Khoury 計算機科學學院助理教授,同時擔任 Broad Institute Eric and Wendy Schmidt 中心的訪問研究科學家。
他于 MIT CSAIL 獲得博士學位,導師為 Regina Barzilay 和 Tommi Jaakkola。
在 AI 藥物發現領網域的算法創新方面,金汶功團隊等變神經網絡、擴散模型等多個方向有所建樹,開發出 RefineGNN、Mol2Image 等模型與算法,成果發表于 NeurIPS、ICLR 等頂會。
在藥物發現方面,團隊成功發現了新型抗生素,成果發表在 Cell 和 Nature 等。
在化學工程領網域,團隊還助力實現自動化化學合成實驗室,其開發的化學反應結果預測算法精度達到化學家級别,相關成果發表于 NeurIPS 和 Chemical Science 等期刊。
教程鏈接:
https://deepgraphlearning.github.io/ProteinTutorial_AAAI2025/
— 完 —
學術投稿請于工作日發郵件到:
标題注明【投稿】,告訴我們:
你是誰,從哪來,投稿内容
附上論文 / 項目主頁鏈接,以及聯系方式哦
我們會(盡量)及時回復你
一鍵關注 點亮星标
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!