中醫大模型來了！臨床診療和養生調理一步到位，發布現場訓練過程大公開，超1100萬條知識圖譜數據

今天小編分享的科學經驗：中醫大模型來了！臨床診療和養生調理一步到位，發布現場訓練過程大公開，超1100萬條知識圖譜數據，歡迎閱讀。

國内醫療大模型，現在又迎來了位新玩家。

還是以中醫為核心的大模型——

岐黃問道 · 大模型，大經中醫出品。

作為國内智慧中醫的代表企業，以往它的個中進展或許并不被廣泛熟知。

但它核心產品中醫臨床智能輔助診療系統，實現了從基層村級衛生室到三甲中醫院的應用覆蓋，積累了 400 多家等級醫院、8000 多家基層醫療機構的用戶。

這也就意味着，一旦大模型規模化落地，就可快速實現到基層的應用。

結果在發布會現場，它直接甩出三個子模型，還進行了現場演示。

基于已确診疾病的臨床診療大模型；

僅僅基于症狀、體征的臨床診療大模型；

中醫養生調理大模型。

以中醫養生調理大模型為例，只需輸入症狀、體征信息。比如輸入怕冷及相關症狀。

大模型就能輸出一系列多維度的養生方案來。包括中藥、經絡穴位、食療、茶飲等一步到位。

△輸入怕冷及相關症狀，給出系列養生方案

年輕人養生的第一個大模型，來了？！！

本以為這樣就結束了，但沒想到的是演示之後，大經中醫竟然還直接公開了正在進行的訓練過程？！

這個玩家究竟什麼來頭？中醫 GPT 首秀實力究竟如何？

中醫 GPT 實力如何？

那就來看看，這個岐黃問道 · 大模型的首秀能力如何？

主要分布兩大場景：中醫輔助診療、中醫健康養生服務。

首先是知病場景——基于已确診疾病的臨床診療大模型的現場演示，即輸入患者 " 疾病 - 症狀 - 體征 " 信息，讓大模型輸出辨證結果、治則治法和中藥方劑。

一上來，它就會自稱「小經醫生」，詢問需要咨詢的疾病。現場輸入慢性胃炎後，它會進一步要求你提供相關的病情。

患者 3 年前出現胃痛，隐隐地痛，有時候會有胃熱的感覺。前年 9 月份去當地人民醫院做了胃鏡檢查，當時診斷為淺表性胃炎。患者平時吃的比較少，胃口一般，口幹，大便幹，睡眠一般，舌紅，脈細數。

最終可以看到，它成功地推斷出了證型「脾胃陰虛型」，并給出了治法、處方以及用藥和用法。

目前該模型已經通過 " 大經數智中醫 " 微信公眾号，向醫療機構開放内測申請。

而即便是那種沒有明确診斷的疾病，只輸入症狀和體征信息。大模型也能輸出完整的結果來，即第二個子模型知症。比如輸入 " 盜汗 " 以及相關病情。

而在健康養生場景下，只需輸入最近困擾你的亞健康問題，就能快速獲取一整套涵蓋艾灸、按摩、膏方、茶飲、膳食、湯羹等内容的養生建議。

這樣的能力，離不開行業數據的支撐和訓練。據大經中醫技術總監王祺表示，在大模型的訓練中，主要用了這些數據集——

1100 萬條中醫知識圖譜數據；1500 本中醫古籍和文獻數據；10 萬份真實中醫專家醫案數據；10 萬條脈象、舌象、經絡、穴位數據；200 萬條真實的中醫臨床診療數據。

而為了這些高質量數據，大經中醫過去投入了數千萬研發費用。

具體訓練方式也在這場發布會上，得到了公開呈現。

主要采用四層遞進的訓練方式：預訓練→監督微調→獎勵模型→強化學習。目前，前兩個階段已經完成，後兩個階段正在持續迭代中。

目前該訓練系統正在由中醫和 AI 兩方面的專家協作完成。中醫專家評估的 ID，已經達到了1704605，足以見其數據規模。

敢一下子放出三個子模型，并在現場直接公開訓練過程，大經中醫底氣從何而來？

岐黃問道大模型如何煉成？

大模型最直觀的範式變革，就是新型人機互動關系的誕生。

不管是通用場景下的搜索引擎，還是垂直場景下的互動模式——

從 UI、OS、EMR（電子病歷）等轉變為自然語言。已預見到的是，「流量入口」、「知識獲取路徑」等都在這場變革中得到重新定義。

既然落地價值顯性，那具體到大模型在垂直場景應用，大經中醫 CEO 李文友認為取決于這三個要素：

數據：高質量行業數據的獲取；

專家：業内高水平專家對預訓練模型的調整、反饋；

場景：具體場景的業務深耕，對具體場景的業務理解，以此實現大模型與行業的有效結合。

歸結起來，就是行業 Know-how，多年領網域深耕積攢下來的行業壁壘。

△大經中醫創始人、CEO 李文友

于大經中醫而言，這種 " 壁壘 " 可以具體展現在三個方面：

數據。

相較于其他醫療分支，中醫知識更為龐雜和個性化，而且歷來有 " 道不傳非人，法不傳六耳 " 的傳統，這就導致高質量數據非常私密，公開數據質量又比較低，因而更需要垂直領網域深耕。

據介紹，基于大量真實名老中醫的診療經驗和中醫文獻中的診療知識，大經中醫構建了中醫診療知識圖譜，涵蓋内外婦兒等全學科、經方時方、孟河嶺南等全流派。據稱是目前業内最高質量的行業數據。

與此同時，還建立了包含 25000+ 個詞條的中醫症狀、體征術語規範化詞典。據介紹，這也是行業中唯一大規模、覆蓋全病種的術語規範化詞典。這樣一來，能夠減少因為措辭差異導致答案不一致的影響。

目前，大經中醫已經積累了 400 多家等級醫院、8000 多家基層醫療機構用戶，形成了大量專業的中醫診療數據。

人才。

據了解，大經中醫擁有全行業規模最大的中醫 -AI 跨界研發團隊，也擁有行業最大的名老中醫團隊，他們通過協定方式合作展開中醫 AI 研究，可在此次大模型研發中，協助開展 RLHF 工作提高性能。

此外，大經中醫還與上海交大計算機科學與工程系等機構專家合作，集成多方技術優勢，共同開展中醫大模型的研究。

應用。

場景應用越豐富，客戶數據越龐雜，越有助于訓練出更理解行業場景和業務的垂直大模型，并且在後續迭代中也能快速形成飛輪效應，更新速度越來越快。

大經中醫現有的 AI 應用場景實現了 B 端和 C 端的覆蓋——

包括廣東省中醫院、上海中醫藥大學附屬龍華醫院在内的等級醫療機構；南京市江寧區、淄博市高青縣等區網域中醫醫聯體，亦或是在上海長寧區 " 為老服務中心 " 這種大健康機構應用，以及下沉到山東、吉林等地村衛生室這種基層醫療機構的應用。

而在 C 端，則以學習強國裡的中醫智能健康助手為例，只需要選擇一些不舒服的表現，就能推薦中醫調理方案。目前用戶已接近 300 萬人。

基于這三點核心優勢，" 岐黃問道 · 大模型 " 的技術路徑也就明晰起來。發布會現場，李文友透露大模型是這樣煉成的。

首先，從名老中醫臨床診療數據 + 中醫文獻數據到中醫診療知識圖譜。

用知識圖譜将這些數據結構化、規範化，從而表達和存儲名老中醫診療經驗和文獻診療知識。

随後，從中醫診療知識圖譜到中醫領網域預訓練模型。

利用千萬級的中醫知識圖譜數據和臨床診療數據，微調通用預訓練模型。

最後，從中醫領網域預訓練模型到岐黃問道大模型。

由中醫專家共同參與，利用獎勵模型 - 強化學習機制，最終形成岐黃問道大模型。

為什麼需要大模型？

大模型發展到現在，不管從個中進展還是業内聚焦探讨，已經從對技術本身的展望，逐漸具象到行業落地中去。

像華為盤古大模型在氣象上的應用登上 Nature 頂刊，它可以在 1.4 秒就能完成 24 小時全球氣象預報，比傳統方法快 1 萬倍。

在教育、遊戲、廣告營銷以及礦山、藥物研發等領網域，大模型都有相應的落地應用。

這兩天，北京交通大學還聯合發布了國内自主研發首款綜合交通大模型TransGPT・致遠，并開源。

李文友認為，在垂直領網域乃至具體場景的應用，正是大模型最大生命力所在。

關于「中醫大語言模型」打造，大經中醫也透露了這兩個方面的原因。

從行業中看，中醫大語言模型有助于中醫藥「數智化」發展。

首先，中醫臨床診療數據、中醫文獻數據大多都是文本數據的形式。擅長自然語言識别處理的大語言模型則有助于中醫傳承發展。

其次，中醫臨床診療既具有完善的理論體系，又具有較強的經驗屬性，因此學中醫素來有" 讀經典、跟名師 "之說。

這些經驗深藏于中醫文獻、典籍中，以及大量歷代醫家的醫案、醫話、醫論中，但理解、記憶、應用這些經驗是一項艱難的任務，中醫大語言模型的出現，将大大改變中醫學習和人才培養的模式。

最後，從中醫的終極思維出發，中醫不僅僅是醫學，也是中國人的生活方式，這也就決定中醫不僅存在于醫院，也存在于家庭，以及各種與健康有關的空間。

而在更廣泛場景中，自然語言的互動方式更符合普通人的溝通習慣。這樣來看，中醫大語言模型，能更加推動中醫 AI 更廣泛落地。

而除了行業維度，對于大經中醫本身而言，還有更深層次的價值。

早在 7 年前，大經中醫就提出：數智化是中醫藥發展的必由之路，并以此為實踐。

核心產品中醫臨床智能輔助診療系統（CDSS）建立起從三甲中醫院到社區衛生服務中心和鄉鎮衛生院，再到診所、門診部、衛生室的各級醫療機構的應用生态。

今年開始，進一步集成了中醫臨床智能輔助診療系統（中醫智腦）、中醫智能脈診儀（中醫智指）、中醫智能舌面診儀（中醫智目）的大經數智中醫一體化診療系統已經逐步走進更多健康服務場景。

△融合了大經中醫一系列軟硬體產品的 " 數智中醫一體化診療系統 "

用他們的話來講，大經數智中醫一體化診療系統已經從 " 嚴肅醫療 " 的生态圈，擴展到 " 中醫大健康 " 的生态圈。

而現在，随着岐黃中醫 GPT 的發布，大經 " 中醫大健康 " 的生态圈将進一步做大，加速更多健康場景的拓展。

發布會上，李文友演講最後還呼籲更多生态夥伴加入。

大模型加速企業生态圈建設，也将進一步加速行業領網域發展，朝着更廣泛場景落地——

日常生活中，中醫也将随處可見。

從企業出發，到行業，最後再普惠到每個人當中，這也是大模型落地更多細分領網域的變革範式。

大模型還可以在哪些領網域碰撞出火花？不妨在這裡期待一下。