公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

Nature!“渐冻症”开发预测模型,仅靠血液数据,AUC高达0.96

Administrator
发布于 2025-08-26 / 4 阅读
0
0

肌萎缩侧索硬化(ALS),又名渐冻症,是一种慢性、进行性神经性疾病,被世界卫生组织列为五大绝症之一。

临床医生长期以来一直在寻找一种可靠的 ALS 诊断方法。迄今为止,ALS 生物标志物的开发主要依赖于单一分析物的研究。

今天和大家分享的这篇文章,选择使用静脉采血获得的血浆蛋白识别可靠的ALS生物标志物,发现的一组由多个通路贡献的 17 种蛋白证实了 ALS 的多重特性,并构建机器学习预测模型诊断ALS。

这项研究于2025年8月19日,发表在Nature Medicine(医学一区,IF=50.0)

我们重点看这篇文章中的机器学习构建预测模型的部分,在此之前,文章做了很多分析,感兴趣的朋友可以去看看原文。

在这项横断面研究中,研究者使用 Olink Explore 3072 平台研究血浆蛋白组学作为该神经退行性疾病的生物标志物工具。与对照组相比,ALS 患者血浆中有 33 种蛋白的丰度存在差异。我们在一个独立队列中重复验证了这些发现。
而后,研究者对蛋白组学数据进行了监督式机器学习,以识别 ALS 的分子特征谱。为此,随机选择 80% 的样本作为训练集,其余样本被指定为测试集。

33 个差异丰度蛋白与临床信息(包括取样时年龄、性别及采血管类型;特征总数 = 36)被作为初始特征输入模型。

研究评估了 10 种监督式机器学习算法

在测试集、外部验证集 1 和外部验证集 2 中,基于总体性能(AUC 与平衡准确率)选择表现最佳的模型(随机森林)。

随机森林模型在训练集上进一步调优,并通过遗传算法特征选择方法对关键预测特征进行优先排序。

经过二次特征选择后,确定了 20 个最具预测性的特征(17 种蛋白、性别、取样时年龄及采血管类型),用于区分 ALS 病例与健康个体及其他神经系统疾病患者。

在测试集中评估时,该模型的曲线下面积(AUC)为 0.962,平衡准确率为 89.3%。

在外部验证集 1中,该模型的 AUC 和平衡准确率分别为 99.8% 和 96.4%。

外部验证集 2中也取得了较高的 AUC 与平衡准确率,分别为 99.1% 和 88.1%。

综上所述,本研究表明血浆蛋白可作为该致命性疾病——渐冻症的生物标志物,并为其前驱期提供了分子层面的见解。

本研究可能的一种结果是,基于血浆的生物标志物可用作 ALS 的筛查工具,而脑脊液检测可用于随后确认。

不过呢,话说回来,这种诊断模型有啥用呢?诊断了也没法提前治疗,只能引起更多的心理问题。

参考文献:Chia, R., Moaddel, R., Kwan, J.Y. et al. A plasma proteomics-based candidate biomarker panel predictive of amyotrophic lateral sclerosis. Nat Med (2025). https://doi.org/10.1038/s41591-025-03890-6


评论