公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

IF=23.1!生存分析预测模型,随机生存森林方法比Cox回归更优?

Administrator
发布于 2025-07-11 / 167 阅读
0
0

医学一区,IF=23.1的杂志《Blood》刊登了一篇机器学习预测模型的研究,题为:“Use of machine learning techniques to predict poor survival after hematopoietic cell transplantation for myelofibrosis”

具体来说:研究者基于随机生存森林机器学习技术(RSF)构建总体生存(OS)预测模型;将其预测性能与基于四分风险等级的Cox回归评分、其他基于同数据集衍生的ML模型,以及国际骨髓移植研究中心(CIBMTR)评分进行比较。

结果表明,ML模型在可推广性及识别高风险患者方面均优于传统方法。

构建随机生存森林机器学习模型

本研究利用2005–2020年间5183例首次接受同种异体造血干细胞移植(allo‑HCT)的骨髓纤维化(MF)患者数据,评估机器学习(ML)模型对移植后总体生存(OS)的预测能力。

将整个队列按75%/25%的比例随机划分为训练集(n = 3887)和测试集(n = 1296)。

特征筛选:研究数据库共包含先前研究证明具有预后意义的52个变量。使用变量重要性估计进行降维,结合临床知识剔除冗余或相关性高的变量,得到最小化而有效的模型。

共包含10个关键预后变量。精简后随机生存森林机器学习技术(RSF)模型在训练集和测试集的C‑指数分别为0.599和0.623。

RSF模型优于其他机器学习模型

基于最终确定的10个变量,评估了三种补充方法:

  • 斜随机生存森林(ORSF)

  • 基于XGBoost的梯度提升生存树

  • 深度神经网络生存模型(DeepSurv)

RSF在训练集和测试集中,C‑指数均优于三种补充方法。

RSF在两组数据上的稳定且优越表现,支持其作为后续分析的首选方法。

RSF模型优于Cox回归评分

为减少偏倚,本分析仅纳入在Cox回归评分所需变量上信息完整的患者子集(训练集n = 1773;测试集n = 566)。

在死亡风险预测中,ML模型在训练集和测试集中的C‑指数均高于Cox评分。Akaike信息准则(AIC)评分进一步验证了这一结果,表明其整体拟合度更佳。

值得注意的是,ML模型与Cox评分相比,将大批原属中-2风险组的患者重新分配至其他风险组。

ML模型识别移植后高风险者能力更强

ML模型的临床价值体现在其对患者进行风险分层的能力上。

值得注意的是,ML模型将25%的患者划入高风险组,远高于Cox评分的10.1%和CIBMTR模型的8.2%。

此外,ML模型不仅识别出更多的高风险患者,而且在训练集和测试集中均表现出一致且可推广的结果。

为了改进临床决策,研究者基于RSF模型开发了一个交互式网页应用(https://gemfin.click/ebmt)。

总之,机器学习技术能够显著提升MF患者在allo‑HCT中的风险分层,为个体化医疗奠定基础。

老郑小评

临床预测建模是一个非常实用的过程,其目的就是为了构建一个能够在实际中应用的预测工具。

成功的预测模型最基本的要求之一就是要有临床意义。

1.首先,它的出发点在于弥补现有模型的不足:“现有的allo‑HCT后总生存预测模型虽然在指导临床决策方面发挥了重要作用,但一些关键因素尚未纳入。此外,这些模型在精准识别移植后高危患者方面仍有提升空间。”

2.其次,预测指标成本低、方便是重要的考虑因素研究者经过降维后,模型简化为10个关键变量,相较于52个变量构建RSF模型,仍在训练集和测试集中对OS与NRM均保持了显著的辨别能力。

3.目前绝大多数临床预测模型可以说是为了构建而构建,并没有完全发挥出其价值。临床预测模型更重要的应用是开发出能供实践的工具,例如基于网页的风险计算器。这篇文章,研究者基于RSF模型开发了一个交互式网页应用(https://gemfin.click/ebmt),直接输入,以方便模型的使用。

4. 在本文随机生存森林也不见得好哪去,毕竟C指数也不高,这就是数据决定了。不过0.6的C指数也能发《blood》杂志,有些惊讶。到底选择随机生存森林还是Cox。我觉得呀,当两者结果相当的时候,仍然优先选择Cox回归,作为广义线性方程,Cox回归结果更好解释,也更容易应用。

参考文献:
Juan Carlos Hernández-Boluda, Adrián Mosquera-Orgueira, Luuk Gras, Linda Koster, Joe Tuffnell,Use of machine learning techniques to predict poor survival after hematopoietic cell transplantation for myelofibrosis. Blood 2025; 145 (26): 3139–3152. doi: https://doi.org/10.1182/blood.2024027287



评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明