今天小編分享的科學經驗:中醫大模型來了!臨床診療和養生調理一步到位,發布現場訓練過程大公開,超1100萬條知識圖譜數據,歡迎閲讀。
國内醫療大模型,現在又迎來了位新玩家。
還是以中醫為核心的大模型——
岐黃問道 · 大模型,大經中醫出品。
作為國内智慧中醫的代表企業,以往它的個中進展或許并不被廣泛熟知。
但它核心產品中醫臨床智能輔助診療系統,實現了從基層村級衞生室到三甲中醫院的應用覆蓋,積累了 400 多家等級醫院、8000 多家基層醫療機構的用户。
這也就意味着,一旦大模型規模化落地,就可快速實現到基層的應用。
結果在發布會現場,它直接甩出三個子模型,還進行了現場演示。
基于已确診疾病的臨床診療大模型;
僅僅基于症狀、體征的臨床診療大模型;
中醫養生調理大模型。
以中醫養生調理大模型為例,只需輸入症狀、體征信息。比如輸入怕冷及相關症狀。
大模型就能輸出一系列多維度的養生方案來。包括中藥、經絡穴位、食療、茶飲等一步到位。
△輸入怕冷及相關症狀,給出系列養生方案
年輕人養生的第一個大模型,來了?!!
本以為這樣就結束了,但沒想到的是演示之後,大經中醫竟然還直接公開了正在進行的訓練過程?!
這個玩家究竟什麼來頭?中醫 GPT 首秀實力究竟如何?
中醫 GPT 實力如何?
那就來看看,這個岐黃問道 · 大模型的首秀能力如何?
主要分布兩大場景:中醫輔助診療、中醫健康養生服務。
首先是知病場景——基于已确診疾病的臨床診療大模型的現場演示,即輸入患者 " 疾病 - 症狀 - 體征 " 信息,讓大模型輸出辨證結果、治則治法和中藥方劑。
一上來,它就會自稱「小經醫生」,詢問需要咨詢的疾病。現場輸入慢性胃炎後,它會進一步要求你提供相關的病情。
患者 3 年前出現胃痛,隐隐地痛,有時候會有胃熱的感覺。前年 9 月份去當地人民醫院做了胃鏡檢查,當時診斷為淺表性胃炎。患者平時吃的比較少,胃口一般,口幹,大便幹,睡眠一般,舌紅,脈細數。
最終可以看到,它成功地推斷出了證型「脾胃陰虛型」,并給出了治法、處方以及用藥和用法。
目前該模型已經通過 " 大經數智中醫 " 微信公眾号,向醫療機構開放内測申請。
而即便是那種沒有明确診斷的疾病,只輸入症狀和體征信息。大模型也能輸出完整的結果來,即第二個子模型知症。比如輸入 " 盜汗 " 以及相關病情。
而在健康養生場景下,只需輸入最近困擾你的亞健康問題,就能快速獲取一整套涵蓋艾灸、按摩、膏方、茶飲、膳食、湯羹等内容的養生建議。
這樣的能力,離不開行業數據的支撐和訓練。據大經中醫技術總監王祺表示,在大模型的訓練中,主要用了這些數據集——
1100 萬條中醫知識圖譜數據;1500 本中醫古籍和文獻數據;10 萬份真實中醫專家醫案數據;10 萬條脈象、舌象、經絡、穴位數據;200 萬條真實的中醫臨床診療數據。
而為了這些高質量數據,大經中醫過去投入了數千萬研發費用。
具體訓練方式也在這場發布會上,得到了公開呈現。
主要采用四層遞進的訓練方式:預訓練→監督微調→獎勵模型→強化學習。目前,前兩個階段已經完成,後兩個階段正在持續迭代中。
目前該訓練系統正在由中醫和 AI 兩方面的專家協作完成。中醫專家評估的 ID,已經達到了1704605,足以見其數據規模。
敢一下子放出三個子模型,并在現場直接公開訓練過程,大經中醫底氣從何而來?
岐黃問道大模型如何煉成?
大模型最直觀的範式變革,就是新型人機互動關系的誕生。
不管是通用場景下的搜索引擎,還是垂直場景下的互動模式——
從 UI、OS、EMR(電子病歷)等轉變為自然語言。已預見到的是,「流量入口」、「知識獲取路徑」等都在這場變革中得到重新定義。
既然落地價值顯性,那具體到大模型在垂直場景應用,大經中醫 CEO 李文友認為取決于這三個要素:
數據:高質量行業數據的獲取;
專家:業内高水平專家對預訓練模型的調整、反饋;
場景:具體場景的業務深耕,對具體場景的業務理解,以此實現大模型與行業的有效結合。
歸結起來,就是行業 Know-how,多年領網域深耕積攢下來的行業壁壘。
△大經中醫創始人、CEO 李文友
于大經中醫而言,這種 " 壁壘 " 可以具體展現在三個方面:
數據。
相較于其他醫療分支,中醫知識更為龐雜和個性化,而且歷來有 " 道不傳非人,法不傳六耳 " 的傳統,這就導致高質量數據非常私密,公開數據質量又比較低,因而更需要垂直領網域深耕。
據介紹,基于大量真實名老中醫的診療經驗和中醫文獻中的診療知識,大經中醫構建了中醫診療知識圖譜 ,涵蓋内外婦兒等全學科、經方時方、孟河嶺南等全流派。據稱是目前業内最高質量的行業數據。
與此同時,還建立了包含 25000+ 個詞條的中醫症狀、體征術語規範化詞典。據介紹,這也是行業中唯一大規模、覆蓋全病種的術語規範化詞典。這樣一來,能夠減少因為措辭差異導致答案不一致的影響。
目前,大經中醫已經積累了 400 多家等級醫院、8000 多家基層醫療機構用户,形成了大量專業的中醫診療數據。
人才。
據了解,大經中醫擁有全行業規模最大的中醫 -AI 跨界研發團隊,也擁有行業最大的名老中醫團隊,他們通過協定方式合作展開中醫 AI 研究,可在此次大模型研發中,協助開展 RLHF 工作提高性能。
此外,大經中醫還與上海交大計算機科學與工程系等機構專家合作,集成多方技術優勢,共同開展中醫大模型的研究。
應用。
場景應用越豐富,客户數據越龐雜,越有助于訓練出更理解行業場景和業務的垂直大模型,并且在後續迭代中也能快速形成飛輪效應,更新速度越來越快。
大經中醫現有的 AI 應用場景實現了 B 端和 C 端的覆蓋——
包括廣東省中醫院、上海中醫藥大學附屬龍華醫院在内的等級醫療機構;南京市江寧區、淄博市高青縣等區網域中醫醫聯體,亦或是在上海長寧區 " 為老服務中心 " 這種大健康機構應用,以及下沉到山東、吉林等地村衞生室這種基層醫療機構的應用。
而在 C 端,則以學習強國裏的中醫智能健康助手為例,只需要選擇一些不舒服的表現,就能推薦中醫調理方案。目前用户已接近 300 萬人。
基于這三點核心優勢," 岐黃問道 · 大模型 " 的技術路徑也就明晰起來。發布會現場,李文友透露大模型是這樣煉成的。
首先,從名老中醫臨床診療數據 + 中醫文獻數據到中醫診療知識圖譜。
用知識圖譜将這些數據結構化、規範化,從而表達和存儲名老中醫診療經驗和文獻診療知識。
随後,從中醫診療知識圖譜到中醫領網域預訓練模型。
利用千萬級的中醫知識圖譜數據和臨床診療數據,微調通用預訓練模型。
最後,從中醫領網域預訓練模型到岐黃問道大模型。
由中醫專家共同參與,利用獎勵模型 - 強化學習機制,最終形成岐黃問道大模型。
為什麼需要大模型?
大模型發展到現在,不管從個中進展還是業内聚焦探讨,已經從對技術本身的展望,逐漸具象到行業落地中去。
像華為盤古大模型在氣象上的應用登上 Nature 頂刊,它可以在 1.4 秒就能完成 24 小時全球氣象預報,比傳統方法快 1 萬倍。
在教育、遊戲、廣告營銷以及礦山、藥物研發等領網域,大模型都有相應的落地應用。
這兩天,北京交通大學還聯合發布了國内自主研發首款綜合交通大模型TransGPT・致遠,并開源。
李文友認為,在垂直領網域乃至具體場景的應用,正是大模型最大生命力所在。
關于「中醫大語言模型」打造,大經中醫也透露了這兩個方面的原因。
從行業中看,中醫大語言模型有助于中醫藥「數智化」發展。
首先,中醫臨床診療數據、中醫文獻數據大多都是文本數據的形式。擅長自然語言識别處理的大語言模型則有助于中醫傳承發展。
其次,中醫臨床診療既具有完善的理論體系,又具有較強的經驗屬性,因此學中醫素來有" 讀經典、跟名師 "之説。
這些經驗深藏于中醫文獻、典籍中,以及大量歷代醫家的醫案、醫話、醫論中,但理解、記憶、應用這些經驗是一項艱難的任務,中醫大語言模型的出現,将大大改變中醫學習和人才培養的模式。
最後,從中醫的終極思維出發,中醫不僅僅是醫學,也是中國人的生活方式,這也就決定中醫不僅存在于醫院,也存在于家庭,以及各種與健康有關的空間。
而在更廣泛場景中,自然語言的互動方式更符合普通人的溝通習慣。這樣來看,中醫大語言模型,能更加推動中醫 AI 更廣泛落地。
而除了行業維度,對于大經中醫本身而言,還有更深層次的價值。
早在 7 年前,大經中醫就提出:數智化是中醫藥發展的必由之路,并以此為實踐。
核心產品中醫臨床智能輔助診療系統(CDSS)建立起從三甲中醫院到社區衞生服務中心和鄉鎮衞生院,再到診所、門診部、衞生室的各級醫療機構的應用生态。
今年開始,進一步集成了中醫臨床智能輔助診療系統(中醫智腦)、中醫智能脈診儀(中醫智指)、中醫智能舌面診儀(中醫智目)的大經數智中醫一體化診療系統已經逐步走進更多健康服務場景。
△融合了大經中醫一系列軟硬體產品的 " 數智中醫一體化診療系統 "
用他們的話來講,大經數智中醫一體化診療系統已經從 " 嚴肅醫療 " 的生态圈,擴展到 " 中醫大健康 " 的生态圈。
而現在,随着岐黃中醫 GPT 的發布,大經 " 中醫大健康 " 的生态圈将進一步做大,加速更多健康場景的拓展。
發布會上,李文友演講最後還呼籲更多生态夥伴加入。
大模型加速企業生态圈建設,也将進一步加速行業領網域發展,朝着更廣泛場景落地——
日常生活中,中醫也将随處可見。
從企業出發,到行業,最後再普惠到每個人當中,這也是大模型落地更多細分領網域的變革範式。
大模型還可以在哪些領網域碰撞出火花?不妨在這裏期待一下。