今天小編分享的互聯網經驗:華為雲喬楠:華為雲只做AI制藥軟體SaaS服務,CRO與自研管線不是我們的目标,歡迎閱讀。
" 我們不會去做 CRO 或自研管線,華為雲的優勢在雲、大數據和 AI 這些軟體領網域,不可能像創業公司一樣招聘很多生物醫藥背景的人做 Biotech,我們也沒有這樣的基因。"
"IT 領網域面向醫療行業的產品和解決方案非常少,沒有很好的產品或工具能夠系統地解決醫療行業中存在的問題。醫療是一個非常細分且瑣碎的行業,做起來又特别難,科技公司在這個領網域的投入是不夠的。"
近日,雷峰網《醫健 AI 掘金志》推出《AI 制藥十人談》系列,探究 AI 制藥的前景與隐憂。
華為雲醫療產品總監,醫療首席科學家喬楠博士在與《醫健 AI 掘金志》的對話中,談到了他對醫療行業產品與服務情況的觀察。
喬楠是 AI 制藥領網域中少有的具有綜合背景的研究者,2013 年博士畢業于中國科學院後,喬楠進入諾華制藥,從事生物信息學分析工作,參與抗癌藥物的研發。在諾華制藥工作期間,還曾獲得諾華團隊合作獎和諾華優選獎。
2015 年喬楠加入埃森哲并領導成立了埃森哲中國 AILab,為不同行業提供的客戶提供產品和解決方案。在埃森哲工作期間,喬楠發現,IT 領網域面向醫療行業的產品和解決方案還不夠豐富,這一領網域仍有待大力發掘。
2018 年,華為公開發布全棧全場景 AI 框架,搭建起了建設 AI To B 業務的重要基礎,喬楠決定加入華為,重新回到制藥行業。
在埃森哲的工作經驗,讓喬楠更加了解不同行業之間的壁壘,熟練掌握如何使用數據庫、AI 等前沿技術解決行業難題。
加入華為雲後,喬楠面臨的首要任務就是打造一個面向醫療行業的 AI 研發平台,喬楠和團隊選定基因組、藥物研發和臨床研究三個方向作為重點,構建起面向醫療行業的 AI 和大數據能力。
依托于華為雲自主研發的盤古藥物分子大模型,聯合中科院上海藥物研究所的蔣華良院士、北京大學的高毅勤教授等業内專家,醫療團隊打造了制藥行業的 EDA 軟體:盤古輔助制藥平台,為藥物研發機構提供 SaaS 化軟體服務。
喬楠指出,藥物設計平台的基礎建設不是一兩家企業獨自能夠完成的,只有國内的科技企業與科研機構一起發力,持續打造出自己的軟體生态,才能避免被國外 " 卡脖子 "。
以下為《醫健 AI 掘金志》與喬楠的對話内容,《醫健 AI 掘金志》做了不改變原意的編輯與整理。
《醫健 AI 掘金志》:您博士畢業于中國科學院生物信息學專業,當時的研究方向是什麼?什麼時候開始接觸藥物研發?
喬楠:我本科學的是自動化,後來轉到生物技術專業,博士期間選擇了生物信息學,師從分子系統生物學專家韓敬東教授。
生物信息學本身是一個交叉學科,我們需要把生物學、數學、計算機、物理、化學等等很多領網域的知識整合起來,運用在生物醫學領網域的數據分析中,構建機器學習的模型或深度學習模型,用來驗證科學家提出的生物學假設。
研究的内容上,我做的比較雜,比如通過文本挖掘,分析文獻中基因的信息;通過分析蛋白質相互作用網絡的數據,尋找潛在藥物的靶點;還有針對基因組數據的各種分析和建模,博士期間的一個工作就是分析 家蠶被病毒侵染之後基因表達量的變化。
另一個比較有意思的工作叫做 "WormFarm"。 Worm 就是是線蟲,是一種常用的模式生物 ,Farm 是農場,代表我們實驗室研發的一種微流控芯片。
我們在指甲蓋大小的微流控芯片上刻 8 個小槽,将很小的線蟲養在其中,每天喂食營養液,讓它們在芯片裡生長,通過設計各種實驗觀察線蟲的表型,比如對線蟲的基因進行敲除之後觀察線蟲的生存時間,通過這些觀察建立起長壽與基因相關的模型,尋找長壽基因與藥物靶點。
《醫健 AI 掘金志》:博士畢業後,您曾在諾華制藥工作過一段時間,您在這一階段專注于哪些研究工作?那一時期 AI 制藥技術的發展情況如何?
喬楠:讀博期間,我做了很多科研數據分析,畢業之後希望能夠進入具體的行業中,看看大家如何用機器學習、數據分析這些技術解決業務問題,于是加入了諾華制藥在張江藥谷建立的研究所。
進入諾華制藥後,我主要從事生物信息學分析工作,分析病人樣本、動物模型、細胞系等不同維度的多組學數據。通過對多組學數據的分析,找到可能的生物标記物或潛在的藥物靶點。同時也對實驗團隊的數據進行分析和建模,指導他們做早期的藥物發現。
我在諾華制藥工作期間,深度學習才興起不久,ImageNet 等相關工作才剛剛發表,藥物設計還處于 CADD 階段(計算機輔助藥物設計),藥企開始使用計算機軟體和算法對藥物進行輔助設計和計算模拟優化,如今興起的 AIDD,也是起源于 CADD,對于 CADD 的一些問題,AI 的算法可以做到更好。
《醫健 AI 掘金志》:您為什麼選擇加入華為雲,擔任醫療產品總監及醫療首席科學家?加入華為雲後您帶領醫療團隊進行了哪些工作?
喬楠:在諾華制藥工作習慣後,我發現日常進行的大多是重復性的工作,我想要看一看在更多的行業中大家如何借助機器學習處理相關業務,于是在 2015 年,我加入埃森哲,擔任埃森哲中國首席數據科學家,并領導成立了埃森哲中國 AILab,面向不同行業的客戶提供 AI 產品和解決方案。
在這個過程中,我發現 IT 領網域面向醫療行業的產品和解決方案非常少,沒有很好的產品或工具能夠系統地解決醫療行業中存在的問題。醫療是一個非常細分且瑣碎的行業,做起來又特别難,科技公司在這個領網域的投入是不夠的。
另一方面,2018 年,華為的輪值董事長徐直軍發布了全棧全場景的 AI 框架,這是建設 AI ToB 業務的重要基礎,一個企業如果想要從頭構建 AI 平台,就必須要有一套全棧全場景的 AI 平台和解決方案。
在 2018 年,全球只有谷歌一家公司有這樣的全棧全場景能力,先後發布過 Tensorflow、TPU、Google Cloud 等產品和平台。
當我看到華為發布了完全國產的全棧全場景 AI 框架時,覺得這是一個非常有前瞻性、非常重要工作,于是決定加入華為雲,重新回到醫療行業。
在埃森哲的工作經歷對我回到醫療行業後的工作幫助很大,讓我了解了不同行業之間的壁壘,如何使用數據庫、AI 等前沿技術解決行業難題,将不同的技能串聯起來,這是很多生物醫藥背景出身的從業者缺乏的能力。
我加入華為之後,首要的任務是打造一個面向醫療行業的 AI 研發平台。
對于任何企業來說這都是一個難題,大部分傳統行業的公司缺乏雲、大數據、AI 背景的人才,很難快速地構建起一個 AI 研發平台,沒有 AI 研發平台公司就很難快速進行研發創新。
所以,我們希望實現的效果是,用戶只要在雲平台上創建一個賬号,訂閱相關的服務,就能夠借助平台的支持進行 AI 研發工作。
醫療行業的細分領網域非常多,華為雲究竟要構建什麼樣的平台?這也是一個很緊要的問題。
我們對醫療行業進行了系統的分析和洞察,最終決定選擇三個方向作為工作的重點,基因組、藥物研發和臨床研究。
圍繞着這三個方向,我們構建起基礎的 AI 和大數據能力,同時,聯合華為雲的技術合作夥伴,高校和中科院研究所共同研發,開發了這些領網域中核心的技術和算法,将其產品化後放到平台上,供醫療行業的研發人員使用。
在一次研讨中,中科院上海藥物研究所的蔣華良院士,北京大學的來魯華教授、高毅勤教授、李洪林教授等業内專家,提到大家在藥物研發領網域涉及到的物理化學、量子力學、量子化學、結構生物學等諸多基礎學科中分别有各自擅長的方向,但教授們開發的算法或工具,往往幾年後就不再進行維護了,缺少連續性。
我們希望和這些教授合作起來,打造出一套完全自主可控的 AI 輔助藥物設計平台。
《醫健 AI 掘金志》:SaaS、AI CRO 與 AI Biotech,是 AI 制藥領網域的三種主要商業模式,華為雲在打造 AI 輔助藥物設計服務平台時,是如何在這三者中進行選擇的?
喬楠:華為雲提供的是 SaaS 化的軟體服務,企業注冊賬号後,開通相關服務即可使用。我們的盤古輔助藥物設計平台是依托華為雲平台打造的,華為雲主要為企業提供 IT 數字化和智能化的服務,旗下的研發人員多為算法工程師、軟體工程師,軟體和算法是我們的優勢,平台本身的定位就是藥物設計軟體,通過 SaaS 化的方式向藥物研發機構提供服務。
我們不會去做 CRO 或自研管線,華為雲的優勢在雲、大數據和 AI 這些軟體領網域,不可能像創業公司一樣招聘很多生物醫藥背景的人做 Biotech,我們也沒有這樣的基因。
《醫健 AI 掘金志》:盤古藥物分子大模型能夠賦能新藥研發流程中的哪些工作?
喬楠:我們的 AI 輔助藥物研發平台能夠覆蓋藥物設計的全流程,為靶點發現、藥物篩選、分子優化三個環節提供強力支撐。
在靶點發現環節,2019 年以來,我們針對基因數據、基因多組學數據、基因調控網絡數據陸續發布了三個算法:AutoGenome、AutoOmics、AutoGGN,通過從細胞系、動物模型、病人身體組織中測到的多組學數據進行 AI 建模,為生物标記物發現和靶點發現等相關問題提供依據。
我們聯合北京大學高毅勤教授團隊開發的蛋白質結構預測算法 MEGA-Protein,可以根據已有的蛋白質序列出蛋白質的三維結構;
獲取蛋白質三維結構以後,下一個任務就是基于元動力學進行靶點發現與構象搜索,找到靶點與配體的可能的結合位置;
我們從軟體和硬體層次對分子動力學模拟工具進行了大幅提升,使計算時間得以縮短。
在藥物篩選環節,我們打造了一個獨有的小分子庫生成功能,基于盤古藥物分子大模型,從模型學習到的類藥化學空間中均衡采樣,生成新穎且類藥性質更優的化合物分子庫,幫助加速藥物篩選過程。
獲得新穎的小分子庫後,可以進行小分子藥物虛拟篩選,這也是 CADD 中最典型的一個功能,除小分子外,平台同樣支持多肽分子的虛拟篩選。
在分子優化環節,分子搜索功能基于華為雲盤古藥物分子大模型的小分子化合物表征,以使用者輸入的參考化合物結構為起點,從海量的小分子庫中搜索到相似結構和排序,可以實現百億級小分子的秒級搜索。
分子屬性預測也是藥物研發中的重要一環,藥物分子設計完成後,不經過實驗驗證就無法了解化合物的性質。盤古藥物分子大模型能夠預測化合物的 ADMET/PKPD 相關的 80 多種成藥性質,給出預測值與置信度。
分子優化功能是 AI 輔助藥物設計中最核心的功能,不論是創新藥還是 Me-too、Me-better,都要基于前期的分子進行改造。使用者在平台中輸入一個分子,指定其結合口袋、分子屬性、分子結構等,即可對分子進行定向優化,我們支持針對 70 餘種分子屬性的多目标優化。
《醫健 AI 掘金志》:數據問題一直是 AI 制藥領網域的痛點,已經成為目前制約 AI 藥物研發的重要因素之一。華為雲為獲取和積累藥物數據做了哪些工作?AI 制藥應如何打破數據孤島?
喬楠:華為雲盤古藥物分子大模型共學習了 17 億個小分子的化學結構。
在藥物設計領網域,尤其是小分子領網域,學術界有很多開源的數據庫可以使用,我們收集的 17 億個小分子化合物全部源于開源信息,我們聯合中科院上海藥物研究所蔣華良院士團隊共同完成了盤古藥物分子大模型的訓練。
在訓練盤古藥物分子大模型時,我們采用了無監督學習的方法,只需要化合物的信息,不需要實驗數據。在學習了這 17 億個小分子化合物後,已經能夠讓大模型比較好地學習到小分子化合物隐含的表征空間。
另一方面,藥物設計是一個非常微觀的過程,小分子化合物、蛋白等都是微觀層次下的結構和狀态。我們可以借助分子動力學模拟等軟體和工具,通過計算和模拟的方法去產生大量的數據,這些數據也可以應用到大模型的訓練之中。
實驗數據是藥企的重要資產,一般無法輕易獲取,數據共享是一個很難的問題,近年來業内在藥物數據共享上做了很多工作,但收效甚微,短期内這一問題都難以解決。
我們能做的就是将盤古藥物分子大模型開放給藥企,讓藥企可以基于自己的數據再加上盤古藥物分子大模型調優自己的模型,用于藥物管線的分子設計與優化。
當藥企的研發工作結束,不再使用這個平台,就可以将自己的數據和模型完全删除,避免洩露。
《醫健 AI 掘金志》:随着 AI 制藥技術的不斷成熟,近年來業内湧現了一批 AI 制藥初創企業,互聯網、科技巨頭在該領網域也多有布局。在眾多競争者之中,盤古藥物分子大模型有哪些差異化優勢?
喬楠:我們希望國内的科技公司、初創企業不斷在 AI 制藥這一領網域加大投入,雖然中國的 AI 制藥行業發展得很好,但目前行業内處于最尖端的仍是歐美國家。這個領網域本身就具有很高的難度,只有大家都投入進來,才能讓中國吃到這一波紅利。
華為在雲、大數據和 AI 領網域有很深的基礎,我們具備建設基礎平台的能力,同時也具備一些核心的技術優勢,比如華為雲自主提出了一套全新的深度學習架構,這是我們專門針對小分子化合物的性質設計的一套架構,能夠更好地學習小分子化合物的深度表征,是盤古藥物分子大模型的核心,決定了大模型的性能和效果。
此外,在 AI 輔助藥物設計平台的產品設計上,我們每年會進行數十次的迭代更新,不斷引入新的技術和方法,并且會吸收用戶提出的建議對產品進行改進和迭代。
《醫健 AI 掘金志》:針對國内創新藥研發現狀,目前還是 Fast Follow 居多,或者是 Me-too、Me-better,這種情況下最需要 AI 去解決什麼問題?
以華為為代表的大型科技公司的入局,将如何推動國内創新藥的發展,優化行業生态?下一步,華為雲将在藥物研發領網域進行哪些新的布局?
喬楠:當前國内情況肯定是 Me-too、Me-better 更多,但是這不是個大問題,比如我們的分子優化工具可以基于 Fast Follow 分子直接進行改造優化,如果優化的結果更好,就是 Me better 藥物了。所以目前的重點是如何讓藥企的研發人員更快、更好地掌握 AI 工具的使用。
在藥物設計這個領網域,國内外的藥企如今應用最多的還是國外的 CADD 軟體,如薛定谔、MOE 等,我們希望中國的科技公司在領網域内不斷投入,構建起國產的藥物設計平台與生态。
這個過程中,必然會涉及到很多基礎能力建設,絕非是一兩家公司獨自就能夠解決的,只有國内的科技公司、科研機構等一起發力,打造出自己的軟體生态,才能夠不斷地更新迭代,優化藥物設計各類工具,提升能力,避免被國外 " 卡脖子 "。
創新藥研發的核心在于生物技術實驗的驗證,而 AI 和 BT 的融合将會起到 1+1 大于 2 的效果,下一階段,我們将會進一步推進對 AI+BT 的融合的制藥平台研究。同時,圍繞藥物設計軟體的更多領網域進行布局,希望能夠支持更多類型的藥物研發。
作為一個開放的平台,我們也支持第三方工具通過華為雲向藥企提供服務,做好產業鏈的協同發展,與下遊夥伴更好地合作,共同推動制藥產業的創新與變革。
《醫健 AI 掘金志》:盤古藥物分子大模型目前已經支撐了多家藥企和科研院的商業服務或藥物管線開發合作,其中有哪些典型案例?
喬楠:我們聯合西安交通大學第一附屬醫院的劉冰教授團隊發現了一款超級抗菌藥 Drug X。
抗生素類藥物如今正面臨的一個很大的危機——抗生素耐藥性(AMR)。根據世界衛生組織(WHO)的預測,到 2050 年,抗生素耐藥性将可能導致超過 1000 萬人死亡,超過癌症導致的死亡人數。
有些藥物甚至在剛剛進入臨床階段時,細菌就已對其產生了耐受。因此,找到能夠對抗耐藥菌的抗生素是非常緊要的任務。
劉冰教授借助華為雲盤古藥物分子大模型的分子優化能力,有效地提升了小分子化合物與目标抗菌靶點蛋白的結合、降低與人體蛋白的結合,從而減弱了 Drug X 對人體正常細胞可能產生的毒副作用。
同時,Drug X 的靶點特質決定了細菌将難以對其產生耐藥性,這一發現對抗瘧(即瘧原蟲)藥物研發等多個領網域有着重要的影響。Drug X 可能會成為全球近 40 年來首個新靶點、新類别的抗生素。
目前,這款藥物正處于臨床前階段,已經進行動物實驗驗證,在推進 IND 申報中,并且已在國際範圍申請專利。
在人體器官芯片領網域,我們與江蘇運動健康研究院院長、東南大學生物科學與醫學工程學院院長顧忠澤教授達成了合作。
顧忠澤教授團隊是國内最早一批開展人體器官芯片研究的團隊,成功構建了腫瘤、皮膚、心髒、血管等多種器官芯片,在部分研究領網域中領先于國際水平。
2022 年 12 月底,FDA 不再要求人體臨床試驗前必須進行動物實驗,人體器官芯片将成為變革性的動物和臨床替代實驗技術。
顧忠澤教授将盤古藥物分子大模型與器官芯片進行了融合,利用盤古藥物分子大模型打通幹溼實驗循環,通過器官芯片獲取更加精準的實驗數據,從而提升臨床試驗的成功率。
在中樞神經系統創新藥物的研發上,蘇州旺山旺水生物醫藥股份有限公司利用盤古輔助制藥平台取得了很好的進展。
中樞神經系統的不可再生性是藥物研發中面臨的一大難題,此外,中樞神經系統相關疾病的病例機制復雜、病程過長等特點,導致藥物實驗的周期過長。
為提升研發效率,旺山旺水公司借助我們的盤古輔助制藥平台,覆蓋藥物研發幹實驗的三大核心環節," 靶點發現和藥效驗證、化合物屬性預測、化合物分子優化設計 ",使藥物設計效率提升了 3 倍,為分子設計實驗節省了 60% 以上的時間、資金成本。
在這些的合作過程中,我們對 BT 與 AI 深度融合的理解逐漸加深,同時客戶也為我們提出了產品改進的建議,我們進行評估後,及時更新到產品的迭代中,進一步完善 AI 輔助藥物設計平台。
《醫健 AI 掘金志》:AI 制藥技術可将先導藥物研發周期大幅縮短,雖然已經有少數藥物進入臨床階段,但到目前為止,AI 驅動研發的藥物仍然沒有一款成功獲批上市,AI 技術研發的藥物距離上市還有多遠?
喬楠:AIDD 為藥物設計的效率和準确性帶來了極大的提升,更重要的是使用起來非常方便,降低了藥物設計的門檻,即便是沒有化學背景的研發人員,經過簡單的培訓後,都可以借助 AI 輔助藥物設計平台來做藥物設計。
很多創業公司也已經開發了 AI 輔助藥物設計的工具和算法,這些工具的效果和價值已經經過了驗證。
藥物研發本身就有一定的周期,并且成功率一直都不算高,正常來說研發一款藥物的成功率只有 10%,Al 工具一定程度上能夠加速研發流程,提高成功率,但是距離 AI 輔助設計的藥物真正上市,還要再等一段時間。
如今這個行業需要解決的問題,一是對藥企的研發人員進行培訓,讓他們都能掌握借助 AI 工具進行藥物設計的方法,提升藥物研發的效率。
關于 GAIR 全球人工智能與機器人大會
" 全球人工智能與機器人大會 "(GAIR)始于 2016 年雷峰網與中國計算機學會(CCF)合作創立的 CCF-GAIR 大會,由鵬城實驗室主任高文院士、香港中文大學(深圳)校長徐揚生院士、GAIR 研究院創始人朱曉蕊、雷峰網創始人林軍等人聯合發起,旨在打造人工智能浪潮下,連接學術界、產業界、投資界的新平台,而雷峰網 " 連接三界 " 的全新定位也在此大會上得以确立。歷屆大會邀請了多位圖靈獎、諾貝爾獎得主、40 位院士、30 位人工智能國際頂會主席、 100 多位 Fellow,同時也有 500 多位知名企業領袖,是亞洲最具國際影響力的 AI 論壇之一。