今天小編分享的教育經驗:首次!百度以第一部門發Nature,歡迎閲讀。
北京時間 5 月 2 日凌晨,國際頂級學術期刊《Nature》正刊發表了百度與合作部門在生物計算領網域的重磅突破性成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出 mRNA 序列優化算法 LinearDesign。
這是中國科技企業首次以第一完成部門的身份在《Nature》雜志發表論文。
鑑于論文對生物醫學領網域的重要性,Nature 雜志在正式排版之前先将預覽版快車道上線 ( accelerated article preview ) ,這也是 AI 應用于 mRNA 領網域的首篇 CNS 主刊論文。
mRNA 疫苗被公認為是遏制 COVID-19 的可行工具, 但 mRNA 疫苗和藥物仍面臨一些挑戰。其中如何高效設計出穩定、成藥性更好的 mRNA 序列,是 mRNA 療法研究領網域的難點之一。
百度運用自然語言處理中網格解析(Lattice Parsing)技術,對 mRNA 疫苗序列進行優化,提升疫苗穩定性和有效性。LinearDesign 算法巧妙地将序列設計的海量計算簡化為自然語言處理中的經典問題,讓 " 大海撈針 " 變成了 " 按圖索骥 "。
以新冠病毒 Spike 蛋白為例,若采用遍歷法尋找一條穩定序列,需要查看 10 的 632 次方個 mRNA 序列。假如由一台超級計算機每秒計算一個序列,那麼從宇宙誕生到現在的 138 億年,連潛在 mRNA 序列的億萬分之一都無法計算完畢,而LinearDesign 算法則能在短短 11 分鍾之内找到最穩定的候選序列。
實驗數據證明,LinearDesign 算法設計序列将有助于生物醫藥公司快速研發更有效的 mRNA 疫苗,縮短研發周期,降低研發成本。這一算法的有效性已經在新冠 mRNA 疫苗和帶狀疱疹 mRNA 疫苗兩種疫苗中得到驗證。與傳統基準相比,百度的設計顯著改善了體外 mRNA 半衰期和蛋白質表達,使體内抗體反應增強了高達 128 倍。
計算 RNA 生物學家戴夫 · 莫格 ( Dave Mauger ) 則認為,這種新方法 " 非常了不起 ",他曾在美國 Moderna 公司工作,一家 mRNA 疫苗制造商。" 計算效率确實令人印象深刻,而且比以往任何時候都更加復雜。"
截至目前,百度已打造完整的基于飛槳的生物計算平台 - 螺旋槳 PaddleHelix,涵蓋文心大模型 - 生物計算大模型,探索 AI 技術在小分子、蛋白 / 多肽、RNA 等場景的應用。其中生物計算等大模型屬于百度文心大模型家族中的一員。
據了解,百度文心大模型形成了系統性的大模型技術體系,包括自然語言處理、視覺、跨模态、生物計算等,最近火爆的文心一言就是百度自主研發的知識增強大語言模型。文心一言通過百度智能雲對外提供服務,為企業構建自己的模型和應用,未來醫療、工業、金融等重點領網域效率将會大幅提升,快速形成新產業空間。