今天小編分享的科技經驗:英偉達要治好誰的病?,歡迎閱讀。
出品 | 虎嗅醫療組
作者 | 陳廣晶、王一鵬
編輯 | 王一鵬
頭圖 | 視覺中國
英偉達在生命科學領網域的野心藏不住了。
生成式 AI 興起後,英偉達的 CEO 黃仁勳頻繁在公開場合談論生命科學,宣稱 " 生命科學工程化 " 即将來臨。事實證明,老黃不玩虛的——在剛剛落幕的英偉達 2024 年 GPU 技術(GTC ) 大會上,醫療健康和生命科學大火了一把,有業内人士統計,總共 900 多場活動中,至少有 90 場與該領網域相關。
尤其是在 GTC 開幕當天,黃仁勳一口氣正式推出了 25 個醫療、生物制藥相關的 " 微服務 ",覆蓋醫學影像、藥物研發和數字健康等領網域。其目标是讓 " 全球醫療企業能夠在任何地點和任何雲上充分利用生成式 AI 的最新進展 "。
在此之前,業界對英偉達的認知,更多集中于 " 賣卡的 "。" 算力,特别是 GPU 是訓練 AI 模型必不可少的生產資料。" 百圖生科首席技術官(CTO ) 宋樂告訴虎嗅。
而英偉達的布局顯然超出了一個硬體供應商的 " 本分 "。從公開數據看,這家全球芯片巨頭已經與超 2500 家相關企業達成合作,包括提供算法的 AI 企業,也包括醫療、制藥領網域巨頭。比如:與強生開發了可實時分析數據的手術機器人,與 GE 開發了可以 " 自動 " 給患者拍片的 " 天眼 CT"。
最近一年,英偉達更是通過投資等方式,将至少 10 家 AI 制藥領網域頭部公司納入麾下。
這不是科技巨頭第一次進軍生命科學領網域,但 2024 這個時間節點,與英偉達這家企業本身,都有着某種特别的含義。
" 像英偉達這樣,将在醫療領網域的布局提到戰略地位,可能在業界還是第一次。" 浙江大學藥學院教授謝昌谕告訴虎嗅。
醫療領網域,不相信算法
對英偉達醫療領網域布局的洞察,必須追溯到生成式 AI 的發展本身。然而看似在技術、商業層面都有無限故事可講的生成式 AI,在醫療健康領網域,可算是踢到了鐵板。
從產業的反應來看,目前 AI 在醫療健康領網域還處于起步階段,很多企業,特别是制藥企業仍然在觀望。有國内知名藥企相關負責人曾公開表示,該公司引入大模型的工作,至今還停留在成本核算階段。
這種遲滞性并不是某一家公司的問題。從數據看,全球每年有超 2500 億美元花在新藥研發上,其中投向 AI 制藥的只有 10 多億美元,預計到 2026 年也不超過 30 億美元。
另據 IDC 的一項調查顯示,醫療健康和生命科學相關企業中只有 14%" 已經在生成 AI 方面進行了大量投資,并在未來 18 個月内制定了‘通過培訓獲取 GenAI 增強軟體和咨詢服務’的支出計劃 ",遠低于全球整體水平(34%),且只有制造業的一半。
與醫療企業對 AI 的疏離感迥然不同的是,技術供應商一直保持着極大的熱情。數據顯示,全球僅 AI+ 生物醫藥公司就有 700 多家;在醫療健康領網域,谷歌、IBM 等巨頭早就有所布局。尤其是 ChatGPT 火起來以後,僅中國就一口氣湧現了近 50 個醫療大模型,從 ToB 的醫生助手到 ToC 的私人健康管家幾乎全品類覆蓋。
醫療健康就像一個冷靜的 " 冰山美人 "," 追求者 " 很多,但極其務實。她清楚地表示,算法只是一個小夥子的 " 發展潛力 ",數據才能代表他的 " 背景與身家 "。
而這恰恰是大部分技術供應商的痛處。
有行業投資人透露,因為難以獲得好的數據,80% 左右的醫療大模型沒有進入第二階段(即:投喂專業數據在某個領網域增強),進入第二階段的 20% 中,絕大部分也沒有進行針對不同的場景、任務的高水平微調。
部分創業公司對内部醫療大模型進行評估時也發現,其能力僅達到 " 助手 " 級别,還稱不上 " 同伴 "。這導致 AI 在短期内無法獨當一面,工作範圍局限在導診、輔助讀片、寫病歷等。
在生物制藥領網域,AI 在蛋白質結構預測、蛋白質生成,甚至抗體藥生成領網域都有很好的表現,但是這些仍然是臨床前階段。在最耗時、最費錢的臨床試驗階段(該階段開銷占新藥總研發費用的 70% 以上),還只能做一些招募患者、做記錄等簡單工作。對于新藥研發成功率低等痛點問題,也沒有實質性改善。
以百圖生科為例。他們提出的長遠目标是用 AI 來模拟生命系統,比如人體免疫系統,理想狀态下可以更好地預測抗體藥進入人體的情況。但在現實落地卻很不容易。" 要實現這個目标,就需要突破一系列多個尺度的 AI 建模問題。"
百圖生科 CTO 宋樂告訴虎嗅,因為蛋白質領網域數據相對較多——已經達到十億規模以上,所以這一領網域的進展最快,不僅能生成蛋白質,甚至可以按照多樣化的設計目标來生成具有功能性的蛋白質,比如成藥性較好的抗體藥,催化效率比較高的酶等。
然而模拟生命系統工程中,不但涉及單個蛋白質分子的生成,還涉及到大量的蛋白質的相互作用、細胞内和細胞之間的相互作用等,但這方面的問題更復雜,相對來說數據處于稀缺狀态,會需要持續的 AI 模型和實驗數據獲取手段的創新和突破。
" 可以想象,蛋白質的數據會呈指數性的增長,生成設計的落地案例也會快速增長。但是這只是一部分,要模拟免疫系統,就需要其他層面也有同樣多的數據,以及與其匹配的 AI 模型創新和迭代,有同樣快速的增長。" 宋樂說。
那麼有了數據,AI 就能在醫療健康領網域暢通無阻了嗎?也不盡然。
比如,醫療領網域的公開數據相對更多,獲取方式更多元,AI+ 醫療在此的進展也更快。就在今年年初,谷歌推出了一款醫學對話 AI —— AMIE(Articulate Medical Intelligence Explorer)。這款應用是繼 Med-PaLM、Med-PaLM2 之後的又一個 "AI 醫生 ",甚至通過了圖靈測試,表現可謂令人驚豔。
盡管從具體表現看,這款在心血管疾病等領網域的診斷領網域,可以做得比保健醫師更好,但仍然無法輕易用到真實患者身上,哈佛大學醫學院專家在接受采訪時直言,醫療絕不是收集信息這麼簡單," 它關乎人與人的關系 "。
在其背後,倫理問題、監管問題、制度問題,以及科學研究本身的進展限制,都是難以突破的障礙。可以說,被頻繁提及的研究數據,只是一個準入門檻,AI+ 醫療健康和生命科學本質上不是要解決一個技術問題,而是一個綜合性的社會問題。
謝昌谕向虎嗅表示,更強的硬體和算法對加速行業發展一定是有幫助,但是并不說今天多了 1000 台 GPU,明天就可以跟你打包票說 AIDD(人工智能藥物發現與設計)會有一個怎樣的進展。
人工智能也被用于提高手術機器人準确性、安全性等。
圖為小觀眾在看單孔腔鏡手術機器人剝鹌鹑蛋。
來自:視覺中國
英偉達版 " 曲線救國 "
因此,像過往所有的技術服務一般,單純由乙方獨立研發,向甲方切割式地交付技術方案,是絕對不行的。醫療、醫藥行業專家必須參與到技術方案演進的過程中,這是 AI 企業在醫療、制藥領網域摸爬滾打、屢敗屢戰六七十年後,最終得出的結論。
在這種合作關系中,藥械企業不僅是買單方,更是數據的生產方,他們不僅解決了誰來買單的問題,也為產品迭代提供了足夠的數據。今天發展最為成熟的 AI+ 醫療影像就是典型案例。
GE、西門子等巨頭将 AI 與大型設備綁定,就人為地建立了數據挖掘機。CT 機、核磁共振機只要每天正常工作,就可以源源不斷為 AI 提供數據養料了。同理,在藥品領網域,沒有誰比出資搞研發的藥企更能理直氣壯地收集數據,AI 企業如果能參與到藥企的工作流程中,也有機會破局。
這道理大家都懂,但實際很難做到,原因也很質樸:藥企不同意。
對于藥企來說,這些數據太貴了。手握大量研發數據的大藥企,每年研發投入都在數十億美元的規模,默沙東、羅氏等研發傳統悠久的企業,相關投入早就超過了百億美元,且有逐年增長的趨勢。這些靠重金砸出來的數據,不僅有機會成就爆款單品,在未來競争中,也會拉開與競争者的距離。
在醫藥市場競争越來越激烈的今天,任何企業也不願意輕易将數據貢獻出來。在這種情況下,要想拿到企業、醫院内部的臨床數據,就只能為他們量身定制模型,讓他們在 " 安全區 " 内感受大模型的威力。
只不過,這種操作成本也是極高的。有業内人士向虎嗅透露,在雲計算推廣過程中也出現過類似的情況,最終很多公司因為虧本嚴重不得不叫停相關業務。大模型定制成本只會更高,他認為,協定金額很可能必須達到 10 億美元級别才能收支平衡。
英偉達對此的策略是 " 曲線救國 "。
英偉達是建生态的一把好手,其在 10 多年前(2006 年)就憑借 CUDA(compute Unified Device Architecture,計算機統一設備體系結構)奠定了在芯片界的競争壁壘。
簡單來說,CUDA 是基于 GPU 設計的軟硬體結合的通用計算構架。其優勢主要有兩個,一個是使用者可以直接與 GPU 結合操控芯片;二是 CUDA 架構為軟體廠商免費提供開發工具,方便軟體開發。前者大大降低了 GPU 的使用門檻,後者方便使用者的同時也悄悄挖深了 " 護城河 " ——随着 " 工具包 " 裡的零件越來越多,其可替代性也大大降低。
由此形成的 CUDA 生态,将英偉達與 AI 深刻綁定,英偉達也借此逐漸甩掉競争對手,實現了逆襲。
在進入醫療健康和生命科學領網域時,英偉達大有将 CUDA 生态的成功經驗照搬過來的勢頭。
按照英偉達公開信息,他們此次推出的 25 個微服務,實際上是以往 " 專業版 " 基礎上的更易操作版本——這些微服務套件中包含了經過優化的 NVIDIA NIM ™ AI 模型和工作流,并提供行業标準應用編程接口(API),可用于創建和部署雲原生應用。
也就是說,醫院、藥企可以根據自己的需求點擊 " 按鈕 " 直接滿足在醫學影像、自然語言和語音識别以及數字生物學生成、預測和模拟功能等領網域的需求。
對于 AI 企業來說,英偉達的品牌背書、行業影響力等帶來了更多機會。" 它是一種導流的平台。" 宋樂告訴虎嗅。百圖生科于 2023 年加入了英偉達招募創業公司的 "NVIDIA 初創加速計劃 ",在今年的 GTC 大會上,宋樂還作為生态合作夥伴代表百圖生科分享了三年來做 AI+ 生物醫藥的經驗。
而在另一邊,英偉達也降低了大模型使用的門檻,方便傳統的醫院、藥企使用他們提供的 " 工具包 " ——比如各種 AI 大模型等。随着工具包的逐漸豐富,以及產業合作方的習慣、依賴,形成新的難以替代的生态。
你很介意軟體企業直接參與業務流程,共享數據?OK,我把 " 傻瓜式 " 工具賣給你,你自己來做。定制模型這種高成本的事情,英偉達是不參與的,不管藥企、雲計算企業雙方怎麼折騰,只要基于我的基礎設施來做,這一商業模式就是成立的。
英偉達的算盤打得很響,但需要注意的是,CUDA 過去面對的是軟體產業,這與醫療產業截然不同,如果僅是照搬 CUDA 的打法,那甚至都無法打開醫療市場。
相對互聯網行業,醫療、制藥非常傳統和封閉,有其獨特的流程。比如:在中國,想說服醫院采購某種產品,不僅要經過復雜的流程,還需要找到正确的渠道。在被認為最需要 AI 的基層,很多醫院的采購渠道掌握在個人或者小代理商手裡,如果找不到他們,再好的產品也與之無緣了。因此,很多 AI+ 醫療企業創業近 10 年也還沒能盈利。
而且科技巨頭 " 攻下 " 醫院、藥企陣地的決心,一直以來都很堅定,導致這一市場還沒發展起來,已經成了紅海了。
AWS、騰訊雲、百度智能雲等,都在這個賽道中 " 跑馬圈地 ",為了争取盡量多的合作者,甚至有國内科技公司的相關負責人公開直言 " 要将構建 AI 場景模型的權利交還給科學家 ",這幾乎就是在向對方剖白,可以不惜成本,滿足對方一切定制化需求了。
此外,英偉達提供的 " 工具包 " 還停留在 " 大眾版 " 的層面上,醫院、藥企如果需要 " 專業版 " 大模型,還是需要與 AI 企業合作。這也讓類似 CUDA 生态的 " 護城河 " 很難形成。
長期以來,國内面向大甲方的生意,都在買方強烈的定制化訴求,與賣方的 " 虧錢能力 " 間左右拉扯。相比之下,英偉達的方式雖然輕巧,卻很難滿足醫療機構、醫生的需求——他們通常更習慣接受積極上門推銷產品的營銷方式,缺乏主動找 " 工具包 " 訓練數據的動力。
較早進入醫療行業的科技公司,幫助基層醫院用遠程技術提高診斷水平。
來自:視覺中國
或有調和成本之争的機會
英偉達的機會,更多是趨勢性的——產業界對 AI 的主要行為是觀望,但在态度上也承認,AI 不再是可有可無的東西,它将從根本上重構生命科學產業。
上世紀 80 年代開始,新藥研發的主戰場從小分子化藥轉向了結構更加復雜的生物藥領網域,總藥物篩選空間可以達到 10 的 60 次方之大,想要靠人力快速篩選出适合的分子幾乎不可能了,這一問題在 " 低垂的果實 " 逐漸摘完、復雜藥物研發成為常态之後越來越突出了。
"AI 在逐漸地變成生物醫藥研發中不可或缺的基本實驗設備。" 宋樂向虎嗅解釋說。他認為,接下來生物藥物研發對 AI 以及後面計算資源的需求量會越來越大。
如今應用 AI 技術,已經可以将新藥研發中的探索臨床前化合物的耗時從原來的 4 年縮短 3/4,到 13.7 個月,甚至壓縮到一個月或 20 多天。另據麥肯錫全球研究所 ( MGI ) 估計,生成式 AI 有望每年為醫療、制藥產業帶來上千億美元經濟價值。
來自:麥肯錫
這樣的數據固然令人心動,但是這對每年全球銷售額超過萬億美元的產業來說,還不構成致命吸引。前述提到新藥研發最大的花銷在臨床試驗階段,AI 在這一領網域能做的還非常有限。同時,目前還沒有任何一款由 AI 設計的藥品上市,也無法證明 AI 可以提高新藥研發的成功率。
因此,制藥企業與 AI 公司合作的過程中,試探性的少量投入更多,且更傾向于在類似密碼子優化的細節上合作。這讓很多 AI 制藥企業的商業化野心很難找到出口。
但這和英偉達有什麼關系呢?至少在五年内,英偉達賣的仍然是基礎設施,不是藥物研發解決方案,讓藥企為态度買單先構建基礎設施,比直接砸錢定制大模型靠譜得多。
況且在中國,醫療機構、制藥企業對 AI 的需求還遠不止于新藥研發。
2018 年以來,藥品、耗材帶量采購等斬斷 " 以藥養醫 " 利益鏈條的改革,以及國家醫保談判、醫保支付方式改革等醫改新政,共同宣告了整個藥品研發、生產、流通到使用環節暴利時代的結束。
在一輪又一輪的瘋狂降價潮中,整個產業鏈上的任何成員,都必須精打細算、想方設法地降本增效。此外,在醫藥反腐風暴不斷更新後,負責銷售藥品的流通企業,還要盡快找到合規的營銷方式。
對于所有這些問題而言,AI 堪稱救命稻草。而英偉達是這個 " 稻草 " 上最為世人矚目的企業。