今天小编分享的科技经验:英伟达要治好谁的病?,欢迎阅读。
出品 | 虎嗅医疗组
作者 | 陈广晶、王一鹏
编辑 | 王一鹏
头图 | 视觉中国
英伟达在生命科学领網域的野心藏不住了。
生成式 AI 兴起后,英伟达的 CEO 黄仁勋频繁在公开场合谈论生命科学,宣称 " 生命科学工程化 " 即将来临。事实证明,老黄不玩虚的——在刚刚落幕的英伟达 2024 年 GPU 技术(GTC ) 大会上,医疗健康和生命科学大火了一把,有业内人士统计,总共 900 多场活动中,至少有 90 场与该领網域相关。
尤其是在 GTC 开幕当天,黄仁勋一口气正式推出了 25 个医疗、生物制药相关的 " 微服务 ",覆盖医学影像、药物研发和数字健康等领網域。其目标是让 " 全球医疗企业能够在任何地点和任何云上充分利用生成式 AI 的最新进展 "。
在此之前,业界对英伟达的认知,更多集中于 " 卖卡的 "。" 算力,特别是 GPU 是训练 AI 模型必不可少的生产资料。" 百图生科首席技术官(CTO ) 宋乐告诉虎嗅。
而英伟达的布局显然超出了一个硬體供应商的 " 本分 "。从公开数据看,这家全球芯片巨头已经与超 2500 家相关企业达成合作,包括提供算法的 AI 企业,也包括医疗、制药领網域巨头。比如:与强生开发了可实时分析数据的手术机器人,与 GE 开发了可以 " 自动 " 给患者拍片的 " 天眼 CT"。
最近一年,英伟达更是通过投资等方式,将至少 10 家 AI 制药领網域头部公司纳入麾下。
这不是科技巨头第一次进军生命科学领網域,但 2024 这个时间节点,与英伟达这家企业本身,都有着某种特别的含义。
" 像英伟达这样,将在医疗领網域的布局提到战略地位,可能在业界还是第一次。" 浙江大学药学院教授谢昌谕告诉虎嗅。
医疗领網域,不相信算法
对英伟达医疗领網域布局的洞察,必须追溯到生成式 AI 的发展本身。然而看似在技术、商业层面都有无限故事可讲的生成式 AI,在医疗健康领網域,可算是踢到了铁板。
从产业的反应来看,目前 AI 在医疗健康领網域还处于起步阶段,很多企业,特别是制药企业仍然在观望。有国内知名药企相关负责人曾公开表示,该公司引入大模型的工作,至今还停留在成本核算阶段。
这种迟滞性并不是某一家公司的问题。从数据看,全球每年有超 2500 亿美元花在新药研发上,其中投向 AI 制药的只有 10 多亿美元,预计到 2026 年也不超过 30 亿美元。
另据 IDC 的一项调查显示,医疗健康和生命科学相关企业中只有 14%" 已经在生成 AI 方面进行了大量投资,并在未来 18 个月内制定了‘通过培训获取 GenAI 增强軟體和咨询服务’的支出计划 ",远低于全球整体水平(34%),且只有制造业的一半。
与医疗企业对 AI 的疏离感迥然不同的是,技术供应商一直保持着极大的热情。数据显示,全球仅 AI+ 生物医药公司就有 700 多家;在医疗健康领網域,谷歌、IBM 等巨头早就有所布局。尤其是 ChatGPT 火起来以后,仅中国就一口气涌现了近 50 个医疗大模型,从 ToB 的医生助手到 ToC 的私人健康管家几乎全品类覆盖。
医疗健康就像一个冷静的 " 冰山美人 "," 追求者 " 很多,但极其务实。她清楚地表示,算法只是一个小伙子的 " 发展潜力 ",数据才能代表他的 " 背景与身家 "。
而这恰恰是大部分技术供应商的痛处。
有行业投资人透露,因为难以获得好的数据,80% 左右的医疗大模型没有进入第二阶段(即:投喂专业数据在某个领網域增强),进入第二阶段的 20% 中,绝大部分也没有进行针对不同的场景、任务的高水平微调。
部分创业公司对内部医疗大模型进行评估时也发现,其能力仅达到 " 助手 " 级别,还称不上 " 同伴 "。这导致 AI 在短期内无法独当一面,工作范围局限在导诊、辅助读片、写病历等。
在生物制药领網域,AI 在蛋白质结构预测、蛋白质生成,甚至抗体药生成领網域都有很好的表现,但是这些仍然是临床前阶段。在最耗时、最费钱的临床试验阶段(该阶段开销占新药总研发费用的 70% 以上),还只能做一些招募患者、做记录等简单工作。对于新药研发成功率低等痛点问题,也没有实质性改善。
以百图生科为例。他们提出的长远目标是用 AI 来模拟生命系统,比如人体免疫系统,理想状态下可以更好地预测抗体药进入人体的情况。但在现实落地却很不容易。" 要实现这个目标,就需要突破一系列多个尺度的 AI 建模问题。"
百图生科 CTO 宋乐告诉虎嗅,因为蛋白质领網域数据相对较多——已经达到十亿规模以上,所以这一领網域的进展最快,不仅能生成蛋白质,甚至可以按照多样化的设计目标来生成具有功能性的蛋白质,比如成药性较好的抗体药,催化效率比较高的酶等。
然而模拟生命系统工程中,不但涉及单个蛋白质分子的生成,还涉及到大量的蛋白质的相互作用、细胞内和细胞之间的相互作用等,但这方面的问题更复杂,相对来说数据处于稀缺状态,会需要持续的 AI 模型和实验数据获取手段的创新和突破。
" 可以想象,蛋白质的数据会呈指数性的增长,生成设计的落地案例也会快速增长。但是这只是一部分,要模拟免疫系统,就需要其他层面也有同样多的数据,以及与其匹配的 AI 模型创新和迭代,有同样快速的增长。" 宋乐说。
那么有了数据,AI 就能在医疗健康领網域畅通无阻了吗?也不尽然。
比如,医疗领網域的公开数据相对更多,获取方式更多元,AI+ 医疗在此的进展也更快。就在今年年初,谷歌推出了一款医学对话 AI —— AMIE(Articulate Medical Intelligence Explorer)。这款应用是继 Med-PaLM、Med-PaLM2 之后的又一个 "AI 医生 ",甚至通过了图灵测试,表现可谓令人惊艳。
尽管从具体表现看,这款在心血管疾病等领網域的诊断领網域,可以做得比保健医师更好,但仍然无法轻易用到真实患者身上,哈佛大学医学院专家在接受采访时直言,医疗绝不是收集信息这么简单," 它关乎人与人的关系 "。
在其背后,伦理问题、监管问题、制度问题,以及科学研究本身的进展限制,都是难以突破的障碍。可以说,被频繁提及的研究数据,只是一个准入门槛,AI+ 医疗健康和生命科学本质上不是要解决一个技术问题,而是一个综合性的社会问题。
谢昌谕向虎嗅表示,更强的硬體和算法对加速行业发展一定是有帮助,但是并不说今天多了 1000 台 GPU,明天就可以跟你打包票说 AIDD(人工智能药物发现与设计)会有一个怎样的进展。
人工智能也被用于提高手术机器人准确性、安全性等。
图为小观众在看单孔腔镜手术机器人剥鹌鹑蛋。
来自:视觉中国
英伟达版 " 曲线救国 "
因此,像过往所有的技术服务一般,单纯由乙方独立研发,向甲方切割式地交付技术方案,是绝对不行的。医疗、医药行业专家必须参与到技术方案演进的过程中,这是 AI 企业在医疗、制药领網域摸爬滚打、屡败屡战六七十年后,最终得出的结论。
在这种合作关系中,药械企业不仅是买单方,更是数据的生产方,他们不仅解决了谁来买单的问题,也为产品迭代提供了足够的数据。今天发展最为成熟的 AI+ 医疗影像就是典型案例。
GE、西门子等巨头将 AI 与大型设备绑定,就人为地建立了数据挖掘机。CT 机、核磁共振机只要每天正常工作,就可以源源不断为 AI 提供数据养料了。同理,在药品领網域,没有谁比出资搞研发的药企更能理直气壮地收集数据,AI 企业如果能参与到药企的工作流程中,也有机会破局。
这道理大家都懂,但实际很难做到,原因也很质朴:药企不同意。
对于药企来说,这些数据太贵了。手握大量研发数据的大药企,每年研发投入都在数十亿美元的规模,默沙东、罗氏等研发传统悠久的企业,相关投入早就超过了百亿美元,且有逐年增长的趋势。这些靠重金砸出来的数据,不仅有机会成就爆款单品,在未来竞争中,也会拉开与竞争者的距离。
在医药市场竞争越来越激烈的今天,任何企业也不愿意轻易将数据贡献出来。在这种情况下,要想拿到企业、医院内部的临床数据,就只能为他们量身定制模型,让他们在 " 安全区 " 内感受大模型的威力。
只不过,这种操作成本也是极高的。有业内人士向虎嗅透露,在云计算推广过程中也出现过类似的情况,最终很多公司因为亏本严重不得不叫停相关业务。大模型定制成本只会更高,他认为,協定金额很可能必须达到 10 亿美元级别才能收支平衡。
英伟达对此的策略是 " 曲线救国 "。
英伟达是建生态的一把好手,其在 10 多年前(2006 年)就凭借 CUDA(compute Unified Device Architecture,计算机统一设备体系结构)奠定了在芯片界的竞争壁垒。
简单来说,CUDA 是基于 GPU 设计的软硬體结合的通用计算构架。其优势主要有两个,一个是使用者可以直接与 GPU 结合操控芯片;二是 CUDA 架构为軟體厂商免费提供开发工具,方便軟體开发。前者大大降低了 GPU 的使用门槛,后者方便使用者的同时也悄悄挖深了 " 护城河 " ——随着 " 工具包 " 里的零件越来越多,其可替代性也大大降低。
由此形成的 CUDA 生态,将英伟达与 AI 深刻绑定,英伟达也借此逐渐甩掉竞争对手,实现了逆袭。
在进入医疗健康和生命科学领網域时,英伟达大有将 CUDA 生态的成功经验照搬过来的势头。
按照英伟达公开信息,他们此次推出的 25 个微服务,实际上是以往 " 专业版 " 基础上的更易操作版本——这些微服务套件中包含了经过优化的 NVIDIA NIM ™ AI 模型和工作流,并提供行业标准应用编程接口(API),可用于创建和部署云原生应用。
也就是说,医院、药企可以根据自己的需求点击 " 按钮 " 直接满足在医学影像、自然语言和语音识别以及数字生物学生成、预测和模拟功能等领網域的需求。
对于 AI 企业来说,英伟达的品牌背书、行业影响力等带来了更多机会。" 它是一种导流的平台。" 宋乐告诉虎嗅。百图生科于 2023 年加入了英伟达招募创业公司的 "NVIDIA 初创加速计划 ",在今年的 GTC 大会上,宋乐还作为生态合作伙伴代表百图生科分享了三年来做 AI+ 生物医药的经验。
而在另一边,英伟达也降低了大模型使用的门槛,方便传统的医院、药企使用他们提供的 " 工具包 " ——比如各种 AI 大模型等。随着工具包的逐渐丰富,以及产业合作方的习惯、依赖,形成新的难以替代的生态。
你很介意軟體企业直接参与业务流程,共享数据?OK,我把 " 傻瓜式 " 工具卖给你,你自己来做。定制模型这种高成本的事情,英伟达是不参与的,不管药企、云计算企业双方怎么折腾,只要基于我的基础设施来做,这一商业模式就是成立的。
英伟达的算盘打得很响,但需要注意的是,CUDA 过去面对的是軟體产业,这与医疗产业截然不同,如果仅是照搬 CUDA 的打法,那甚至都无法打开医疗市场。
相对互联网行业,医疗、制药非常传统和封闭,有其独特的流程。比如:在中国,想说服医院采购某种产品,不仅要经过复杂的流程,还需要找到正确的渠道。在被认为最需要 AI 的基层,很多医院的采购渠道掌握在个人或者小代理商手里,如果找不到他们,再好的产品也与之无缘了。因此,很多 AI+ 医疗企业创业近 10 年也还没能盈利。
而且科技巨头 " 攻下 " 医院、药企阵地的决心,一直以来都很坚定,导致这一市场还没发展起来,已经成了红海了。
AWS、腾讯云、百度智能云等,都在这个赛道中 " 跑马圈地 ",为了争取尽量多的合作者,甚至有国内科技公司的相关负责人公开直言 " 要将构建 AI 场景模型的权利交还给科学家 ",这几乎就是在向对方剖白,可以不惜成本,满足对方一切定制化需求了。
此外,英伟达提供的 " 工具包 " 还停留在 " 大众版 " 的层面上,医院、药企如果需要 " 专业版 " 大模型,还是需要与 AI 企业合作。这也让类似 CUDA 生态的 " 护城河 " 很难形成。
长期以来,国内面向大甲方的生意,都在买方强烈的定制化诉求,与卖方的 " 亏钱能力 " 间左右拉扯。相比之下,英伟达的方式虽然轻巧,却很难满足医疗机构、医生的需求——他们通常更习惯接受积极上门推销产品的营销方式,缺乏主动找 " 工具包 " 训练数据的动力。
较早进入医疗行业的科技公司,帮助基层医院用远程技术提高诊断水平。
来自:视觉中国
或有调和成本之争的机会
英伟达的机会,更多是趋势性的——产业界对 AI 的主要行为是观望,但在态度上也承认,AI 不再是可有可无的东西,它将从根本上重构生命科学产业。
上世纪 80 年代开始,新药研发的主战场从小分子化药转向了结构更加复杂的生物药领網域,总药物筛选空间可以达到 10 的 60 次方之大,想要靠人力快速筛选出适合的分子几乎不可能了,这一问题在 " 低垂的果实 " 逐渐摘完、复杂药物研发成为常态之后越来越突出了。
"AI 在逐渐地变成生物医药研发中不可或缺的基本实验设备。" 宋乐向虎嗅解释说。他认为,接下来生物药物研发对 AI 以及后面计算资源的需求量会越来越大。
如今应用 AI 技术,已经可以将新药研发中的探索临床前化合物的耗时从原来的 4 年缩短 3/4,到 13.7 个月,甚至压缩到一个月或 20 多天。另据麦肯锡全球研究所 ( MGI ) 估计,生成式 AI 有望每年为医疗、制药产业带来上千亿美元经济价值。
来自:麦肯锡
这样的数据固然令人心动,但是这对每年全球销售额超过万亿美元的产业来说,还不构成致命吸引。前述提到新药研发最大的花销在临床试验阶段,AI 在这一领網域能做的还非常有限。同时,目前还没有任何一款由 AI 设计的药品上市,也无法证明 AI 可以提高新药研发的成功率。
因此,制药企业与 AI 公司合作的过程中,试探性的少量投入更多,且更倾向于在类似密码子优化的细节上合作。这让很多 AI 制药企业的商业化野心很难找到出口。
但这和英伟达有什么关系呢?至少在五年内,英伟达卖的仍然是基础设施,不是药物研发解决方案,让药企为态度买单先构建基础设施,比直接砸钱定制大模型靠谱得多。
况且在中国,医疗机构、制药企业对 AI 的需求还远不止于新药研发。
2018 年以来,药品、耗材带量采购等斩断 " 以药养医 " 利益链条的改革,以及国家医保谈判、医保支付方式改革等医改新政,共同宣告了整个药品研发、生产、流通到使用环节暴利时代的结束。
在一轮又一轮的疯狂降价潮中,整个产业链上的任何成员,都必须精打细算、想方设法地降本增效。此外,在医药反腐风暴不断更新后,负责销售药品的流通企业,还要尽快找到合规的营销方式。
对于所有这些问题而言,AI 堪称救命稻草。而英伟达是这个 " 稻草 " 上最为世人瞩目的企业。