今天小編分享的科技經驗:通過AI算法發現阿爾茨海默病診斷新型标志物 復旦大學程炜:可提前15年預測發病風險,歡迎閲讀。
每 3 秒,全球就會多 1 位痴呆患者,其中約 60%~80% 會被确診為阿爾茨海默病(AD)。而在中國,AD 患者已經超過 1000 萬人,醫療費用高達每年 1.6 萬億元。
提高 AD 早期就診率,抓住黃金幹預時間窗,是業内公認的 AD 診療策略。今年 7 月,復旦大學附屬華山醫院神經内科郁金泰教授團隊領銜,聯合復旦大學類腦智能科學與技術研究院的馮建峰 / 程炜團隊,在 Nature Human Behavior 發表論文揭開了一種新生物标志物 YWHAG 的面紗。
9 月 6 日上午,在由每日經濟新聞主辦的見解論壇 "AI 醫藥革命:產業鏈創新之路 " 上,復旦大學類腦智能科學與技術研究院研究員程炜對相關研究進行了詳盡介紹。他表示,新型标志物的挖掘和早期識别離不開大數據和 AI 算法的助力," 一管血測 AD" 的時代已經近了。
圖片來源:主辦方提供
大數據和算法是兩塊重要拼圖
作為一種連續發展長達 10 年 ~20 年的老年疾病,阿爾茨海默病的早期幹預是治療關鍵。根據 2023 年發表在 Nature Human Behaviour 的一項研究,如果在 AD 早期借助藥物或訓練調節既往病史、生活方式、身體指标等可控因素,可降低 47%~72.6% 的 AD 的發生。
但在國内,AD 患者的臨床早期就診率只有 14%。程炜表示,這是因為 AD 起病隐匿,各階段生物學指标演化規律尚不清晰,早期風險識别模型的準确率與解釋性不足,導致 AD 的早期識别和預測非常困難,而這也在很大程度上影響了單抗藥物等 AD 治療藥物的療效。
因此,獲取 AD 患者的非臨床數據,構建早期風險識别模型,是 AI 輔助 AD 早期預防和診治的關鍵,其中大數據和算法是兩塊重要拼圖。
程炜介紹,目前,國内外圍繞 AD 建立了大量的隊列數據庫。例如,英國的 UK Biobank 是一個涵蓋社區人群的大型數據庫,跟蹤了約 50 萬名 35 歲 ~50 歲參與者近 20 年的生活方式和生化指标;美國的 All of Us 則囊括了約 100 萬名社區成員,通過結合體檢機構和臨床樣本的數據,構建了一個龐大的美國人群健康隊列。
參照國外的研究,中國也在衰老和痴呆社區隊列上進行了大量投入。目前,由復旦大學附屬華山醫院神經内科郁金泰教授領導的科技創新 2030 —— " 腦科學與類腦研究 " 重大項目,已經依托華山醫院在全國範圍内建立了社區腦健康衰老隊列(head 隊列),旨在在中國不同地區招募 2 萬名參與者,通過長期随訪進行縱向研究,描繪個體從健康狀态逐漸發展到痴呆症狀的全過程。
此外,AI 算法在老年腦疾病智能診療、推動老年健康領網域取得了顯著進展。例如,結合 AI 算法和醫院病例數據,可以實現對患者復發的有效預測;通過多模态數據的融合,應用深度學習算法,可以對不同 AD 亞型做出精準預測,精度超過臨床專家。
YWHAG 可作為 AD 早期診斷、預警指标
" 有了大數據,也有了 AI 算法,我們做的就是通過它們發現 AD 診斷新型标志物。" 程炜表示,AD 從無症狀期發展到有症狀期大約需要 20 年,而腦脊液生物标志物在 AD 病程中最先發生變化,因此團隊的首個研究工作是聚焦大規模人群的腦脊液蛋白質組數據,并基于這些數據開發出一種生成分析算法,識别與 AD 相關的蛋白質。
在這一過程中,團隊從數千種腦脊液蛋白質中篩選出多個與 AD 顯著相關的生物标志物,發現 YWHAG、SMOC1、PIGR 與 TMOD2 是 AD 診斷最重要的蛋白。根據四個蛋白構建的 AI 模型,四個蛋白在 AUC(此值越接近 1,模型的診斷能力越好)上達到 0.987 的高準确度,超過了傳統的 A β 42 生物标志物;即便只使用 YWHAG 單個蛋白,也能實現 0.97 的準确率。
為了驗證該模型的泛化能力,研究者還将其應用到屍檢病理隊列和獨立外部隊列中,發現上述蛋白仍能以高 AUC 值準确判斷個體是否患有 AD,其中 YWHAG 在屍檢病理隊列和獨立外部隊列中診斷 AUC 達 0.83 和 0.93,并且 YWHAG 能夠預測從認知正常向前驅期 AD 的轉化,以及從 MCI(輕度認知障礙)向 AD 痴呆的轉化,與 AD 核心病理标志物以及認知能力下降密切相關。
除了診斷,這些蛋白是否可用于 AD 預警呢?程炜所在的研究團隊還從臨床角度考察了這些蛋白質的縱向預測能力,即通過基線時蛋白質水平的高低将人群分為兩組,可觀察到高水平組随着時間推移,發病人群逐漸增加,從而證明了這些蛋白質可作為早期預警指标。另外,研究還探讨了這些蛋白質與 β 澱粉樣蛋白、Tau 蛋白等 AD 經典病理标志物的關聯,發現它們高度相關。
基線與随訪 圖片來源:演講者供圖
血液檢測能提前 15 年預警 AD 風險
" 不過,這些新的生物标志物和此前的生物标志物的性能差不多,更重要的還是要看它們能不能在血液中被檢測出來。" 程炜説。
目前,AD 早期診斷可以通過腦脊液檢測或 PET(正電子發射斷層成像)測量進行,但前者是有創檢測,後者相當昂貴。因此,程炜的團隊将研究對象從腦脊液蛋白質組轉到血液蛋白質組,希望找到公眾更容易接受的檢測方式。
好消息是,研究團隊基于 11 種血液蛋白構建的 AD 風險預警模型,AUC 達到 0.85 左右;生存分析表明 GFAP、NEFL、GDF15 等蛋白與各種痴呆發病相關,且這些蛋白質在 AD 患者發病前 15 年就已表現出顯著差異。而且,GFAP 這一蛋白質還顯示出特異性,僅對 AD 有預測價值。
基于此,研究團隊構建了基于機器學習的預測模型,通過效果值方法對蛋白質的重要性進行排序,結果與臨床發現高度一致。最終,團隊構建的預測模型能夠提前 15 年預測 AD 發病風險,對于 AD 的蛋白組合,聯合模型 AUC 可以達到 0.854,對于痴呆 AUC 可以達到 0.841,為社區篩查提供了潛在可能。
但程炜指出,蛋白質的檢測成本仍然比較昂貴,為了使模型更便于推廣,團隊基于 UK Biobank 的 50 萬人縱向随訪數據,繪制了 AD 臨床診斷前 15 年多維度表型的變化軌迹,并基于顯著變化的指标構建了簡易的 AD 預測模型,該模型僅依賴于血漿 GFAP 與簡便的人口學特征,AUC 就可以達到 0.872。
" 其實除了 AD,我們還希望将模型推廣到其他老年疾病的風險預警。" 程炜透露,目前團隊還構建了基于血液蛋白組學的多疾病早期預測模型、基于神經網絡的蛋白風險預測模型,他認為未來通過數字化平台和大模型框架,可以實現更多社區人群、更多疾病的早期預警和幹預。
每日經濟新聞