今天小編分享的科學經驗:當大模型時代到來,如何借助 AI 驅動生命科學與醫藥創新,歡迎閱讀。
近年來,利用 AI 技術驅動業務創新與發展已經成為行業共識。2021 年,DeepMind 發布了 AlphaFold2,憑借自身在蛋白質結構預測上的高可信度,以及遠優于傳統實驗方法的效率和成本表現,樹立起一座 "AI for Science" 的全新裡程碑。AlphaFold2 不僅在生命科學領網域掀起了颠覆式的革新,也成為了 AI 在生物學、醫學和藥學等領網域落地的核心發力點。
那麼,當大模型時代到來,Al 輔助的生命科學研究和制藥将迎來哪些變化?AlphaFold2 是否還是制勝的法寶?它如何在英特爾 ® 架構的 CPU 和加速器平台上實現顯著性能優化 ?
潞晨科技創始人兼董事長,NUS 校長青年教授尤洋、英特爾人工智能架構師楊威和百圖生科 AI 算法負責人、資深總監王太峰三位專家,圍繞《AI 驅動的生命科學與醫藥創新》這一主題進行了精彩的分享。
AI 大模型驅動生命科學與制藥創新,提速降本成為關鍵
" 用 AI 大模型驅動生命科學與制藥創新的關鍵在于降低模型訓練成本,提高訓練效率。"
尤洋在主題為《AI 大模型驅動的生命科學與醫藥創新》的分享中指出,過去六年大模型參數量每 18 個月增長了 40 倍,過去三年每 18 月增長了 340 倍,而硬體的增長速度大概每 18 個月增長 1.7 倍,已經完全跟不上節奏。
而訓練世界頂尖 AI 大模型成本高、周期長,因此降低成本,提高效率,成為擺在生命科學與醫藥行業面前最大的挑戰。
潞晨科技開發了 Colossal-AI 系統,包括高效内存管理系統、N 維并行系統和低延遲推理系統,三位一體地幫助用戶降低訓練成本,提高訓練效率。
作為當下最火熱的開源 AI 大模型解決方案之一,Colossal-AI 已收獲 Github Star 七千多顆,此前在 Stable Diffusion、GPT-3、AlphaFold 等大模型上也展現出了卓越的性能優勢。
潞晨科技與英特爾的合作,正是關于蛋白質結構預測方案的優化。
優化方案充分利用了 Colossal-AI 的大模型優化能力,使用英特爾 ® 至強 ® 可擴展處理器進行數據預處理,并用英特爾 AI 專用加速芯片 Habana ® Gaudi ® 加速了 AlphaFold2 模型推理的執行。相比于之前應用的方案,AlphaFold2 端到端推理速度最高提 3.86 倍,相較 GPU 方案,應用成本最多降低 39%!
尤洋還表示,對于超長序列蛋白質結構的推理,通過引入至強 ® 可擴展處理器,發揮其内置加速硬體在 AI 推理上的優勢,也能取得十分卓越的效果。
大幅優化 AlphaFold2 的性能,第四代英特爾 ® 至強 ® 可擴展平台解讀
面對大模型時代到來,Al 輔助的生命科學研究和制藥将迎來新變化,英特爾 ® 至強 ® 可擴展平台能否實現更進一步的性能優化?英特爾人工智能架構師楊威進行了詳細的解讀。
在 2022 年,英特爾以第三代至強 ® 可擴展平台為硬體基座,對 AlphaFold2 實施了端到端的高通量優化,累計通量提升可達優化前的 23.11 倍。
今年,英特爾采用第四代至強 ® 可擴展處理器對 AphaFold2 進行優化,在第三代的基礎上使通量再獲得高達 3.02 倍的提升。
AlphaFold2 是一個科學計算 +AI 的混合計算管線,在計算過程中可以将它抽成預處理、深度學習模型推理和後處理三個階段。
基于第四代至強 ® 可擴展處理器的優化方案主要聚焦在預處理和模型推理兩個層面,用五大步驟助 AlphaFold2 實現端到端優化,以多項針對 AI 工作負載的優化加速技術為 AlphaFold2 推理帶來 " 推背感 "。
具體的優化步驟和優化加速技術,歡迎大家注冊觀看本期《至強實戰課》,或點擊 " 閱讀原文 " 鏈接獲取白皮書。
面向未來,加速創新!持續探索 AI 在生命科學與醫藥上的新方向、新趨勢、新挑戰
大模型無疑是近來科技圈最火爆的技術之一,它在醫藥和生命科學領網域大步發展,也在此領網域中發揮着巨大的作用。
百圖生科 AI 算法負責人、資深總監王太峰認為,在傳統的制藥領網域去設計蛋白質,或者淘選有用的蛋白質,往往都是利用傳統實驗,受限于當前物種現存在的一些蛋白質。當需要為特定病種去設計更好的蛋白質藥物的時候,往往需要跨越已有的限制去重新設計,或者從頭去 de novo 這些蛋白。這就需要研究人員對于整個蛋白領網域有非常完善的知識。
據介紹,通過大語言的模型,或者基于生物體的裡面的這些自然語言(包括所有的蛋白質和氨基酸等等的序列),通過這些非常大規模的蛋白質數據,從中學習或理解到這些蛋白質内在的一些規律。基于這個規律從頭去設計新的蛋白質,這就是生物大語言模型之所以需要存在的一個非常必要的原因。
今年,百圖生科開放了 AIGP(AI Generated Protein)平台,并正致力于借助此平台加速研發工作,降低研發成本,并使其成為一個即插即用的平台,讓更多的藥物設計公司能夠復用這些平台的建設。
未來,是否還會有更多 AI 輔助的生命科學研究和制藥領網域的創新?是否還有更多算法可以在生命科學和醫藥創新領網域裡找到機遇和探索的空間?讓我們拭目以待。
如果您對本文涉及的基于 Habana ® Gaudi ® 與英特爾 ® 至強 ® 可擴展處理器對 AlphaFold2 進行端到端優化的技術細節感興趣,如果您也想了解百圖生科在 AIGP 領網域的最新進展,英特爾《至強實戰課》之《AI 驅動的生命科學與醫藥創新》将為您帶來更加全面且詳細的真人講解,歡迎大家掃描海報中的二維碼注冊收看;
點擊 " 閱讀原文 " 也可以了解更多英特爾 ® 至強 ® 可擴展平台對 AlphaFold2 的優化詳情。
* 本文系量子位獲授權刊載,觀點僅為作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和產品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>