今天小編分享的科技經驗:微軟推出 LLaVA-Med AI 模型,可對醫學病理案例進行分析,歡迎閲讀。
品玩 6 月 14 日訊,近日,微軟研究人員展示了 LLaVA-Med 模型,該模型主要用于生物醫學方面的研究,可根據 CT、X 光圖片等推測出患者的病理狀況。
據悉,微軟研究人員與一批醫院合作,獲得了使用生物醫學影像文本對應大型數據集來訓練多模态 AI 模型。該數據集包括胸部 X 光、MRI、組織學、病理學和 CT 影像等,覆蓋範圍相對全面。
微軟使用 GPT-4,基于 Vision Transformer 和 Vicuna 語言模型,在八個英偉達 A100 GPU 上對 LLaVA-Med 進行訓練,其中包含 " 每個影像的所有預分析信息 ",用于生成有關影像的問答,以滿足 " 可自然語言回答有關生物醫學影像問題 " 的助手願景。
在學習過程中,模型主要圍繞 " 描述此類影像的内容 " 以及 " 闡述生物醫學概念 " 而展開。據微軟稱,該模型最終具有 " 出色的多模式對話能力 "、" 在用于回答視覺問題的三個标準生物醫學數據集上,LLaVA-Med 在部分指标上領先于業界其他先進模型 "。