今天小编分享的科技经验:通过AI算法发现阿尔茨海默病诊断新型标志物 复旦大学程炜:可提前15年预测发病风险,欢迎阅读。
每 3 秒,全球就会多 1 位痴呆患者,其中约 60%~80% 会被确诊为阿尔茨海默病(AD)。而在中国,AD 患者已经超过 1000 万人,医疗费用高达每年 1.6 万亿元。
提高 AD 早期就诊率,抓住黄金干预时间窗,是业内公认的 AD 诊疗策略。今年 7 月,复旦大学附属华山医院神经内科郁金泰教授团队领衔,联合复旦大学类腦智能科学与技术研究院的冯建峰 / 程炜团队,在 Nature Human Behavior 发表论文揭开了一种新生物标志物 YWHAG 的面纱。
9 月 6 日上午,在由每日经济新闻主办的见解论坛 "AI 医药革命:产业链创新之路 " 上,复旦大学类腦智能科学与技术研究院研究员程炜对相关研究进行了详尽介绍。他表示,新型标志物的挖掘和早期识别离不开大数据和 AI 算法的助力," 一管血测 AD" 的时代已经近了。
图片来源:主办方提供
大数据和算法是两块重要拼图
作为一种连续发展长达 10 年 ~20 年的老年疾病,阿尔茨海默病的早期干预是治疗关键。根据 2023 年发表在 Nature Human Behaviour 的一项研究,如果在 AD 早期借助药物或训练调节既往病史、生活方式、身体指标等可控因素,可降低 47%~72.6% 的 AD 的发生。
但在国内,AD 患者的临床早期就诊率只有 14%。程炜表示,这是因为 AD 起病隐匿,各阶段生物学指标演化规律尚不清晰,早期风险识别模型的准确率与解释性不足,导致 AD 的早期识别和预测非常困难,而这也在很大程度上影响了单抗药物等 AD 治疗药物的疗效。
因此,获取 AD 患者的非临床数据,构建早期风险识别模型,是 AI 辅助 AD 早期预防和诊治的关键,其中大数据和算法是两块重要拼图。
程炜介绍,目前,国内外围绕 AD 建立了大量的队列数据库。例如,英国的 UK Biobank 是一个涵盖社区人群的大型数据库,跟踪了约 50 万名 35 岁 ~50 岁参与者近 20 年的生活方式和生化指标;美国的 All of Us 则囊括了约 100 万名社区成员,通过结合体检机构和临床样本的数据,构建了一个庞大的美国人群健康队列。
参照国外的研究,中国也在衰老和痴呆社区队列上进行了大量投入。目前,由复旦大学附属华山医院神经内科郁金泰教授领导的科技创新 2030 —— " 腦科学与类腦研究 " 重大项目,已经依托华山医院在全国范围内建立了社区腦健康衰老队列(head 队列),旨在在中国不同地区招募 2 万名参与者,通过长期随访进行纵向研究,描绘个体从健康状态逐渐发展到痴呆症状的全过程。
此外,AI 算法在老年腦疾病智能诊疗、推动老年健康领網域取得了显著进展。例如,结合 AI 算法和医院病例数据,可以实现对患者复发的有效预测;通过多模态数据的融合,应用深度学习算法,可以对不同 AD 亚型做出精准预测,精度超过临床专家。
YWHAG 可作为 AD 早期诊断、预警指标
" 有了大数据,也有了 AI 算法,我们做的就是通过它们发现 AD 诊断新型标志物。" 程炜表示,AD 从无症状期发展到有症状期大约需要 20 年,而腦脊液生物标志物在 AD 病程中最先发生变化,因此团队的首个研究工作是聚焦大规模人群的腦脊液蛋白质组数据,并基于这些数据开发出一种生成分析算法,识别与 AD 相关的蛋白质。
在这一过程中,团队从数千种腦脊液蛋白质中筛选出多个与 AD 显著相关的生物标志物,发现 YWHAG、SMOC1、PIGR 与 TMOD2 是 AD 诊断最重要的蛋白。根据四个蛋白构建的 AI 模型,四个蛋白在 AUC(此值越接近 1,模型的诊断能力越好)上达到 0.987 的高准确度,超过了传统的 A β 42 生物标志物;即便只使用 YWHAG 单个蛋白,也能实现 0.97 的准确率。
为了验证该模型的泛化能力,研究者还将其应用到尸检病理队列和独立外部队列中,发现上述蛋白仍能以高 AUC 值准确判断个体是否患有 AD,其中 YWHAG 在尸检病理队列和独立外部队列中诊断 AUC 达 0.83 和 0.93,并且 YWHAG 能够预测从认知正常向前驱期 AD 的转化,以及从 MCI(轻度认知障碍)向 AD 痴呆的转化,与 AD 核心病理标志物以及认知能力下降密切相关。
除了诊断,这些蛋白是否可用于 AD 预警呢?程炜所在的研究团队还从临床角度考察了这些蛋白质的纵向预测能力,即通过基线时蛋白质水平的高低将人群分为两组,可观察到高水平组随着时间推移,发病人群逐渐增加,从而证明了这些蛋白质可作为早期预警指标。另外,研究还探讨了这些蛋白质与 β 淀粉样蛋白、Tau 蛋白等 AD 经典病理标志物的关联,发现它们高度相关。
基线与随访 图片来源:演讲者供图
血液检测能提前 15 年预警 AD 风险
" 不过,这些新的生物标志物和此前的生物标志物的性能差不多,更重要的还是要看它们能不能在血液中被检测出来。" 程炜说。
目前,AD 早期诊断可以通过腦脊液检测或 PET(正电子发射断层成像)测量进行,但前者是有创检测,后者相当昂贵。因此,程炜的团队将研究对象从腦脊液蛋白质组转到血液蛋白质组,希望找到公众更容易接受的检测方式。
好消息是,研究团队基于 11 种血液蛋白构建的 AD 风险预警模型,AUC 达到 0.85 左右;生存分析表明 GFAP、NEFL、GDF15 等蛋白与各种痴呆发病相关,且这些蛋白质在 AD 患者发病前 15 年就已表现出显著差异。而且,GFAP 这一蛋白质还显示出特异性,仅对 AD 有预测价值。
基于此,研究团队构建了基于机器学习的预测模型,通过效果值方法对蛋白质的重要性进行排序,结果与临床发现高度一致。最终,团队构建的预测模型能够提前 15 年预测 AD 发病风险,对于 AD 的蛋白组合,联合模型 AUC 可以达到 0.854,对于痴呆 AUC 可以达到 0.841,为社区筛查提供了潜在可能。
但程炜指出,蛋白质的检测成本仍然比较昂贵,为了使模型更便于推广,团队基于 UK Biobank 的 50 万人纵向随访数据,绘制了 AD 临床诊断前 15 年多维度表型的变化轨迹,并基于显著变化的指标构建了简易的 AD 预测模型,该模型仅依赖于血浆 GFAP 与简便的人口学特征,AUC 就可以达到 0.872。
" 其实除了 AD,我们还希望将模型推广到其他老年疾病的风险预警。" 程炜透露,目前团队还构建了基于血液蛋白组学的多疾病早期预测模型、基于神经网络的蛋白风险预测模型,他认为未来通过数字化平台和大模型框架,可以实现更多社区人群、更多疾病的早期预警和干预。
每日经济新闻