现如今,在预测模型领域中,传统回归模型和机器学习模型应用已经十分广泛,各有优缺点。
在机器学习构建预测模型文章中,也经常出现Logistic回归。
那为什么郑老师说,如果机器学习预测模型差别不大,首推传统logistic回归呢?
借上海交通大学学者2025年5月发表的一篇文章,一起来探讨一下!
这篇文章基于常规血液检查指标,利用七种机器学习算法构建抑郁症临床风险预测模型,虽然随机森林(RF)模型预测性能最佳,但最终选择logistic回归(LR)模型。
RF模型最优,但最终选择LR模型
本回顾性研究纳入上海市精神卫生中心 2024 年 1 月至 10 月期间确诊的 284 例抑郁障碍患者,以及同期体检的 214 名健康对照者。通过医院信息系统检索并收集参试者的血液检测数据。
随后,将数据按随机方式分为训练集(70%)和测试集(30%)。
1.特征筛选
首先进行单变量 logistic 回归分析,筛选出11个 p<0.1 的潜在预测因子;
随后对显著变量分别采用 10 折交叉验证的 LASSO 回归和 Boruta 算法进行特征选择,并取两者交集构建预测模型。
2.构建机器学习预测模型
基于 LASSO 回归和 Boruta 特征筛选出的4个特征,采用决策树(DT)、随机森林(RF)、极端梯度提升(XGBoost)、k 近邻(KNN)、LightGBM、支持向量机(SVM)和逻辑回归(LR)七种机器学习算法构建并评估了预测模型。
3.预测性能评估
在所有算法中,随机森林模型表现最佳,训练集 AUC 达到 1.00,验证集 AUC 为 0.958,显示出卓越的预测能力。
4.SHAP分析
对RF模型进行SHAP分析,变量重要性排序见下图。
5.RF模型与logistic回归模型比较
尽管 RF 模型在验证集上的 AUC 最佳,但出于对潜在过拟合的担忧,研究者进行了进一步评估。
将 RF 模型(AUC = 0.958)与逻辑回归(LR)模型(AUC = 0.914)在验证集上的 AUC 进行比较,差异无统计学意义(P = 0.105)。
鉴于逻辑回归模型具有较高的可解释性和简便性,最终选择该模型作为最终模型,绘制列线图。
6.多变量 Logistic 回归及模型构建
以疾病诊断为因变量构建了多变量 Logistic 回归模型。
各变量间未见多重共线性,保证了模型的稳定性和可靠性。
7.logistic回归预测模型预测性能
该预测模型的性能主要通过鉴别能力和校准情况来评估。
经 500 次自助法重采样后,训练集和验证集均显示出在区分抑郁障碍患者与健康对照方面具有卓越的鉴别能力。
校准曲线显示预测概率与实际观测结果高度一致。Hosmer–Lemeshow 拟合优度检验进一步确认了模型优异的校准性能。
8.列线图构建
基于多变量分析中的四个关键预测因子,构建了列线图,用于直观展示预测模型。
9.列线图的临床实用性评估
采用决策曲线分析(DCA)评估列线图的临床效益。结果显示,在阈值概率 0%–100% 范围内,列线图均可获得最大净收益。
这表明该模型具有较强的临床适用性,可辅助抑郁障碍的风险分层和临床决策。
老郑小评
上海交通大学学者的这篇研究,内容十分丰富,也可以很好的解释我们今天要讲的内容。
机器学习与logistic回归构建预测模型各有优势。
机器学习由于其出色的性能,在预测模型的效果较好,但往往存在过拟合、其结果不易解释、可视化效果不如传统模型,在临床上应用也存在一些阻碍。
而通过logistic回归构建的列线图作为一种强大的临床决策辅助工具,以其直观、易用、全面的特点,为医生们提供了极大的便利。它让复杂的预测过程变得简单明了,帮助医生在临床实践中做出更加精准、科学的决策。
所以,模型选择是一个权衡的过程。在预测性能没有显著差异,差别不大的情况下,郑老师认为,传统logistic回归的透明度和简单性通常是更负责任和更实用的选择。
参考文献:
Jin W, Chen S, Wang M, Lin P. A Clinical Risk Prediction Model for Depressive Disorders Based on Seven Machine Learning Algorithms. Int J Gen Med. 2025;18:2461-2473.https://doi.org/10.2147/IJGM.S524016