算法狂欢的时代,为何这篇"返璞归真"的研究能登顶柳叶刀子刊?
老郑看到这样一篇文章,在机器学习横扫科研圈的今天,仅用Logistic回归构建预测模型,发表在期刊《eBioMedicine》(医学一区top,IF=9.7)上,题为:“Multivariate predictive model of the therapeutic effects of metoprolol in paediatric vasovagal syncope: a multi-centre study”,作者是北大学者。
研究者旨在通过多中心研究、扩大样本量,并采用更严格的方法学,利用多种临床和生理学指标开发预测模型,以识别可能从美托洛尔治疗中获益的VVS患儿,并验证这些模型在临床实践中的应用价值。
看到还是有点小惊讶的!和诸位做个分享。
本研究共纳入478例接受美托洛尔治疗的VVS儿童患者,患者分别来自三家儿童晕厥中心:北京大学第一医院、首都儿科研究所附属儿童医院和中南大学湘雅二医院。明确划分为两个独立队列:
回顾性训练队列:用于模型开发(2017年3月–2023年3月,n=323)。
前瞻性外部验证队列:用于模型验证(2023年4月–2024年3月,n=155)。
根据患者在接受美托洛尔治疗1–3个月后的症状改善情况,将其分为应答组和非应答组。
本文预测模型开发和验证很规范,也很常规!
筛选变量
1.单因素分析:P<0.05的变量纳入共线性分析。
2.共线性分析:采用线性回归模型评估变量间共线性程度,并计算方差膨胀因子(VIF)和容差值(Tolerance),设定VIF<10且Tolerance>0.1为可接受范围。
通过单因素分析结果,基于共线性分析结果及临床相关性,筛选出12个关键指标。
3.多因素Logistic回归及向后逐步回归。
4.似然比检验:评估每个变量对模型的贡献,P值>0.05的变量在选择过程中被移除。
最终保留的变量在逻辑回归模型中均具有统计学意义、较低的多重共线性,并对美托洛尔治疗效果预测具有较高的预测价值。
开发并验证预测模型
基于最后的结果,研究者建立了以下回归方程,以预测美托洛尔在儿童VVS中的治疗效果:
1.开发预测模型,包括基线ΔHR、QTcd和SDNN,以列线图形式展示。
2.训练集模型性能评估:
区分度:使用受试者工作特征(ROC)曲线评估,ROC曲线下面积(AUC)为0.900;
校准度:校准曲线显示其预测值与实际观察值高度一致,H-L检验表明预测模型与实际结果具有良好一致性(χ² = 7.242,P = 0.511);
临床实用性:决策曲线分析(DCA)表明,该列线图模型可显著提高临床获益。
3.内部验证:采用自助法(bootstrap)进行,结果显示,预测模型的准确率为0.806,Kappa值为0.608,表明该模型具有较好的预测价值。
4.外部验证:列线图模型的C指数为0.81,表明其具有良好的区分能力,AUC为0.784(95% CI: 0.705–0.863)。并计算模型的灵敏度、特异度和准确度。使用H-L检验评估评分模型在验证队列中的拟合优度。
本研究首次开发并验证了美托洛尔治疗儿童 VVS 疗效的预测模型。所建立的列线图和评分模型可帮助临床医生预测和选择治疗方案,从而实现儿童 VVS 患者的个体化治疗。
老郑小评
是不是很简单,很常规的方法?能发表到柳叶刀子刊,那它的优势在哪呢?
首先,这项精准狙击临床痛点,弥补了研究空白!
其次,教科书级验证设计!模型性能评估(区分度、校准度、临床实用性)三件套;内部验证、外部验证,既评价可重复性,又评价可泛化性。做的很规范。
临床实用性强,预测模型的价值在于应用,筛选出来的变量也不是越多越好,并且与其他研究相比,本研究所使用的指标测量方法无创、快速、简单且经济。
在算法内卷的时代,这项研究用最朴素的统计学方法证明:临床价值>技术复杂度。一个模型好不好,关键还是数据,而不是统计算法。