公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

中国学者用常规回归方法构建预测模型,该文章的优势是?

Administrator
发布于 2025-07-09 / 12 阅读
0
0

算法狂欢的时代,为何这篇"返璞归真"的研究能登顶柳叶刀子刊?

老郑看到这样一篇文章,在机器学习横扫科研圈的今天,仅用Logistic回归构建预测模型,发表在期刊《eBioMedicine》(医学一区top,IF=9.7)上,题为:“Multivariate predictive model of the therapeutic effects of metoprolol in paediatric vasovagal syncope: a multi-centre study”,作者是北大学者。

研究者旨在通过多中心研究、扩大样本量,并采用更严格的方法学,利用多种临床和生理学指标开发预测模型,以识别可能从美托洛尔治疗中获益的VVS患儿,并验证这些模型在临床实践中的应用价值。

看到还是有点小惊讶的!和诸位做个分享。


本研究共纳入478例接受美托洛尔治疗的VVS儿童患者,患者分别来自三家儿童晕厥中心:北京大学第一医院、首都儿科研究所附属儿童医院和中南大学湘雅二医院。明确划分为两个独立队列:

  • 回顾性训练队列:用于模型开发(2017年3月–2023年3月,n=323)。

  • 前瞻性外部验证队列:用于模型验证(2023年4月–2024年3月,n=155)。

根据患者在接受美托洛尔治疗1–3个月后的症状改善情况,将其分为应答组和非应答组。

本文预测模型开发和验证很规范,也很常规!

筛选变量

1.单因素分析:P<0.05的变量纳入共线性分析。

2.共线性分析:采用线性回归模型评估变量间共线性程度,并计算方差膨胀因子(VIF)和容差值(Tolerance),设定VIF<10且Tolerance>0.1为可接受范围。

通过单因素分析结果,基于共线性分析结果及临床相关性,筛选出12个关键指标。

3.多因素Logistic回归及向后逐步回归。

4.似然比检验:评估每个变量对模型的贡献,P值>0.05的变量在选择过程中被移除。

最终保留的变量在逻辑回归模型中均具有统计学意义、较低的多重共线性,并对美托洛尔治疗效果预测具有较高的预测价值。

开发并验证预测模型

基于最后的结果,研究者建立了以下回归方程,以预测美托洛尔在儿童VVS中的治疗效果:

1.开发预测模型,包括基线ΔHR、QTcd和SDNN,以列线图形式展示。

2.训练集模型性能评估:

  • 区分度:使用受试者工作特征(ROC)曲线评估,ROC曲线下面积(AUC)为0.900;

  • 校准度:校准曲线显示其预测值与实际观察值高度一致,H-L检验表明预测模型与实际结果具有良好一致性(χ² = 7.242,P = 0.511);

  • 临床实用性:决策曲线分析(DCA)表明,该列线图模型可显著提高临床获益。

3.内部验证:采用自助法(bootstrap)进行,结果显示,预测模型的准确率为0.806,Kappa值为0.608,表明该模型具有较好的预测价值。

4.外部验证:列线图模型的C指数为0.81,表明其具有良好的区分能力,AUC为0.784(95% CI: 0.705–0.863)。并计算模型的灵敏度、特异度和准确度。使用H-L检验评估评分模型在验证队列中的拟合优度。

本研究首次开发并验证了美托洛尔治疗儿童 VVS 疗效的预测模型。所建立的列线图和评分模型可帮助临床医生预测和选择治疗方案,从而实现儿童 VVS 患者的个体化治疗。

老郑小评

是不是很简单,很常规的方法?能发表到柳叶刀子刊,那它的优势在哪呢?

首先,这项精准狙击临床痛点,弥补了研究空白!

其次,教科书级验证设计!模型性能评估(区分度、校准度、临床实用性)三件套;内部验证、外部验证,既评价可重复性,又评价可泛化性。做的很规范。

临床实用性强,预测模型的价值在于应用,筛选出来的变量也不是越多越好,并且与其他研究相比,本研究所使用的指标测量方法无创、快速、简单且经济。

在算法内卷的时代,这项研究用最朴素的统计学方法证明:临床价值>技术复杂度。一个模型好不好,关键还是数据,而不是统计算法。


评论