公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

机器学习预测模型发文Lancet子刊,首次看到10倍EPV样本量用公式展示

Administrator
发布于 2025-07-17 / 11 阅读
0
0

【欢迎阅读浙中大郑老师撰写的统计科普文】

预测模型文章中,我们一般用10倍EPV原则计算样本量,这也是目前公认的方法,但很少有学者会在文章中详细地解释。

老郑也是第一次在预测模型文章的正文中看到计算样本量的过程,并且是以公式来展示。接下来,一起来看看这篇中国学者发表在Lancet子刊的预测模型文章。

原文阅读

2025年1月,中国学者在顶级期刊Lancet子刊《eClinicalMedicine》(医学一区top,IF=9.6)发表了一篇题为:“Development and validation of a model to predict cognitive impairment in traumatic brain injury patients: a prospective observational study”的研究论文,研究者构建了一个用于早期预测认知障碍的可视化在线风险计算器,并使用前瞻性队列进行验证,证实了模型的准确性和一致性。

(如果你需要全文,在医学论文与统计分析微信公众号后台回复关键词“pdf”。如果你也想尝试机器学习,来看看我们的基于R语言构建机器学习临床预测模型课程吧!详情可咨询助教,微信号:aq566665

本研究的数据来自苏州大学附属第三医院神经外科,纳入年龄≥ 18岁、首次发生颅脑创伤且出院时完全清醒的患者,共涉及两个队列:

  • 训练集:包括234例患者(其中72.65%被确定为认知障碍),均于2017年5月至2020年4月在苏州大学附属第三医院神经外科住院;

  • 验证集:包括84例患者(其中59.52%被确定为认知障碍),是根据同样的纳排标准,前瞻性收集的2024年3月1日至2024年8月30日在苏州大学附属第三医院神经外科住院的TBI患者。

在该项研究中,研究团队基于EPV(Events Per Variable )原则提供了一个非常清晰的样本量计算公式。

  • 具体来说,在训练集中,TBI后一个月认知障碍的发生率为0.72(Incidence Rate=0.72)

  • 研究者计划纳入6个预测变量Number of Variables=6

  • 并将EPV设置为10(EPV=10)

最终通过以下公式计算出所需的训练集样本量:

EPV原则是被广泛接受的样本量计算方法,诸位的文章也可以参考这种写法。

√数据处理

研究者使用R中的“mice”包中的md. pattern()函数评估了缺失数据的模式,以确定缺失数据的机制。使用R语言的mice包进行多重插补。

√预实验

在预实验中,研究团队使用四种机器学习算法构建预测模型,包括训练支持向量机(SVMLinear)、随机森林(RF)、K近邻(KNN)和广义线性模型(GLM)。

分别在训练集和验证集中对模型的性能进行评估,评估指标包括AUC值、灵敏度、特异度、校准曲线和临床决策分析(DCA)曲线。

研究结果显示,在训练集中,SVMLinear、RF、KNN 和 GLM 模型的 AUC 分别为 0.91、0.99、0.92 和 0.91;而在验证集中,这些模型的 AUC 分别下降到 0.81、0.81、0.77 和 0.81。

基于上述研究结果,研究者认为在该项研究中,传统的logistic回归建模方法优于这四种机器学习算法。

√特征的选择

首先,使用最小绝对收缩和选择算子(LASSO)方法筛选出8个具有非零系数的自变量。

然后,使用多变量logistic回归分析得到6个最佳预测因子(P < 0.05)。

包括:年龄、受教育年限、肺部感染状态、癫痫状态、CSF渗漏状态和赫尔辛基评分。

√共线性分析

在模型开发阶段,研究者评估了变量之间潜在的共线性问题。结果表明,所有公差值均超过0.1,方差膨胀因子(VIF)均低于10,表明无显著共线性。

√交互作用分析

此外,研究团队分析了交互作用效应,发现自变量之间没有实质性的交互作用,交互作用的p值保持在0.1以上。

√模型的构建

基于6个预测因子,绘制列线图,构建脑外伤后认知障碍预测模型。

  • 列线图的总得分是分配给每个风险因素的得分之和,得分越高表明发生认知障碍的风险越大。

√模型的评估

使用AUC值、灵敏度、特异度、DCA和校准曲线评估预测模型的性能。

研究结果显示,该预测模型的性能较好,训练集的AUC为0.90,截断值为0.71;验证集的AUC为0.87,截断值为0.63。

此外,对于验证集,研究团队预先定义了AUC的可接受性能差异(Δ)小于0.05。

根据上述结果,研究团队观察到训练集和验证集之间的AUC差异(Δ = 0.03)小于0.05,这意味着样本量足以评估模型的泛化能力及其在前瞻性验证中的适用性。

校准曲线与理想的对角线紧密对齐,反映了预测概率和实际结果之间的高度一致性。验证队列中的校准曲线也显示出很好的一致性。

此外,训练队列的决策曲线分析(DCA)显示,在广泛的阈值概率范围内,该模型的净收益始终大于两种极端策略(包括所有变量或不包括变量),表明其潜在的临床效用。验证队列也呈现相同的结果。

√可视化在线风险计算器

研究团队基于预测因子的回归系数创建了一个预测图,详情可在以下网站查询,所有人均可免费使用。该图提供了每个预测因子影响的可视化表示,帮助临床医生在临床实践中进行个体化风险评估。

https://yuanxiaofang.shinyapps.io/Predict_cognitive_impairment_in_TBI/

综上所述,在这项研究中,研究团队基于6个预测因子构建了一个TBI后认知功能障碍的预测模型,并在此基础上建立了一个可视化和个性化的TBI后认知障碍的在线风险计算器。

【感谢阅读浙中大郑老师团队撰写的统计文章】


评论