今天小编分享的科学经验:当大模型时代到来,如何借助 AI 驱动生命科学与医药创新,欢迎阅读。
近年来,利用 AI 技术驱动业务创新与发展已经成为行业共识。2021 年,DeepMind 发布了 AlphaFold2,凭借自身在蛋白质结构预测上的高可信度,以及远优于传统实验方法的效率和成本表现,树立起一座 "AI for Science" 的全新里程碑。AlphaFold2 不仅在生命科学领網域掀起了颠覆式的革新,也成为了 AI 在生物学、医学和药学等领網域落地的核心发力点。
那么,当大模型时代到来,Al 辅助的生命科学研究和制药将迎来哪些变化?AlphaFold2 是否还是制胜的法宝?它如何在英特尔 ® 架构的 CPU 和加速器平台上实现显著性能优化 ?
潞晨科技创始人兼董事长,NUS 校长青年教授尤洋、英特尔人工智能架构师杨威和百图生科 AI 算法负责人、资深总监王太峰三位专家,围绕《AI 驱动的生命科学与医药创新》这一主题进行了精彩的分享。
AI 大模型驱动生命科学与制药创新,提速降本成为关键
" 用 AI 大模型驱动生命科学与制药创新的关键在于降低模型训练成本,提高训练效率。"
尤洋在主题为《AI 大模型驱动的生命科学与医药创新》的分享中指出,过去六年大模型参数量每 18 个月增长了 40 倍,过去三年每 18 月增长了 340 倍,而硬體的增长速度大概每 18 个月增长 1.7 倍,已经完全跟不上节奏。
而训练世界顶尖 AI 大模型成本高、周期长,因此降低成本,提高效率,成为摆在生命科学与医药行业面前最大的挑战。
潞晨科技开发了 Colossal-AI 系统,包括高效内存管理系统、N 维并行系统和低延迟推理系统,三位一体地帮助用户降低训练成本,提高训练效率。
作为当下最火热的开源 AI 大模型解决方案之一,Colossal-AI 已收获 Github Star 七千多颗,此前在 Stable Diffusion、GPT-3、AlphaFold 等大模型上也展现出了卓越的性能优势。
潞晨科技与英特尔的合作,正是关于蛋白质结构预测方案的优化。
优化方案充分利用了 Colossal-AI 的大模型优化能力,使用英特尔 ® 至强 ® 可扩展处理器进行数据预处理,并用英特尔 AI 专用加速芯片 Habana ® Gaudi ® 加速了 AlphaFold2 模型推理的执行。相比于之前应用的方案,AlphaFold2 端到端推理速度最高提 3.86 倍,相较 GPU 方案,应用成本最多降低 39%!
尤洋还表示,对于超长序列蛋白质结构的推理,通过引入至强 ® 可扩展处理器,发挥其内置加速硬體在 AI 推理上的优势,也能取得十分卓越的效果。
大幅优化 AlphaFold2 的性能,第四代英特尔 ® 至强 ® 可扩展平台解读
面对大模型时代到来,Al 辅助的生命科学研究和制药将迎来新变化,英特尔 ® 至强 ® 可扩展平台能否实现更进一步的性能优化?英特尔人工智能架构师杨威进行了详细的解读。
在 2022 年,英特尔以第三代至强 ® 可扩展平台为硬體基座,对 AlphaFold2 实施了端到端的高通量优化,累计通量提升可达优化前的 23.11 倍。
今年,英特尔采用第四代至强 ® 可扩展处理器对 AphaFold2 进行优化,在第三代的基础上使通量再获得高达 3.02 倍的提升。
AlphaFold2 是一个科学计算 +AI 的混合计算管线,在计算过程中可以将它抽成预处理、深度学习模型推理和后处理三个阶段。
基于第四代至强 ® 可扩展处理器的优化方案主要聚焦在预处理和模型推理两个层面,用五大步骤助 AlphaFold2 实现端到端优化,以多项针对 AI 工作负载的优化加速技术为 AlphaFold2 推理带来 " 推背感 "。
具体的优化步骤和优化加速技术,欢迎大家注册观看本期《至强实战课》,或点击 " 阅读原文 " 链接获取白皮书。
面向未来,加速创新!持续探索 AI 在生命科学与医药上的新方向、新趋势、新挑战
大模型无疑是近来科技圈最火爆的技术之一,它在医药和生命科学领網域大步发展,也在此领網域中发挥着巨大的作用。
百图生科 AI 算法负责人、资深总监王太峰认为,在传统的制药领網域去设计蛋白质,或者淘选有用的蛋白质,往往都是利用传统实验,受限于当前物种现存在的一些蛋白质。当需要为特定病种去设计更好的蛋白质药物的时候,往往需要跨越已有的限制去重新设计,或者从头去 de novo 这些蛋白。这就需要研究人员对于整个蛋白领網域有非常完善的知识。
据介绍,通过大语言的模型,或者基于生物体的里面的这些自然语言(包括所有的蛋白质和氨基酸等等的序列),通过这些非常大规模的蛋白质数据,从中学习或理解到这些蛋白质内在的一些规律。基于这个规律从头去设计新的蛋白质,这就是生物大语言模型之所以需要存在的一个非常必要的原因。
今年,百图生科开放了 AIGP(AI Generated Protein)平台,并正致力于借助此平台加速研发工作,降低研发成本,并使其成为一个即插即用的平台,让更多的药物设计公司能够复用这些平台的建设。
未来,是否还会有更多 AI 辅助的生命科学研究和制药领網域的创新?是否还有更多算法可以在生命科学和医药创新领網域里找到机遇和探索的空间?让我们拭目以待。
如果您对本文涉及的基于 Habana ® Gaudi ® 与英特尔 ® 至强 ® 可扩展处理器对 AlphaFold2 进行端到端优化的技术细节感兴趣,如果您也想了解百图生科在 AIGP 领網域的最新进展,英特尔《至强实战课》之《AI 驱动的生命科学与医药创新》将为您带来更加全面且详细的真人讲解,欢迎大家扫描海报中的二维码注册收看;
点击 " 阅读原文 " 也可以了解更多英特尔 ® 至强 ® 可扩展平台对 AlphaFold2 的优化详情。
* 本文系量子位获授权刊载,观点仅为作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追踪 AI 技术和产品新动态
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>