随着人工智能与机器学习在医学领域的广泛应用,大多数研究仍集中于模型开发阶段,而非将其实际应用于临床。因此,前瞻性验证与实时实施成为确保模型可靠性、泛化能力与临床实用性的关键步骤。
最近在医学顶刊Lancet子刊《Lancet Digital Health》(医学一区top,IF=24.1)看到一篇非常有意思的研究论文。 该研究来自一个庞大的国际多中心团队,为精准预测“T+A”免疫联合疗法(阿替利珠单抗+贝伐珠单抗)对晚期肝细胞癌患者的疗效,结合了13种特征筛选方法与7种机器学习算法构建预测模型。
近年来,蛋白质组学结合机器学习构建临床预测模型的研究越来越多。但一个核心难题始终存在,如何从海量蛋白中筛选出真正有价值的预测特征?
为帮助研究人员对模型的预测准确性做出可靠而公正的评价,顶级医学期刊BMJ在2023年底陆续发布了三篇临床预测模型评估指南。我们也将用三篇推文系统地介绍这一指南。
顶级医学期刊BMJ在2023年底陆续发布了三篇临床预测模型评估指南,为研究人员开展临床预测模型研究提供了权威的参考资料。本系列推文的第1篇介绍了BMJ指南中几类模型内部验证的方法以及外部验证研究的意义。
临床预测模型系列方法自从被提出到火热已经有很长一段时间,这个时间可能可以追溯到新世纪之初。不过,随着机器学习和深度学习的火热,临床预测模型的方法学得到了很大的扩展,这也直接造就了最近几年的“群雄逐鹿”盛况。
顶级医学期刊BMJ在2023年底陆续发布了三篇临床预测模型评估指南,为研究人员开展临床预测模型研究提供了权威的参考资料。本系列推文的前两篇围绕BMJ指南的内容详细介绍了模型内部验证和外部验证方法。而本推文是模型评估系列文章的最后一篇,将结合案例针对性地介绍如何计算外部验证所需的样本量。
乳头状甲状腺癌(PTC)是内分泌系统中最常见的恶性肿瘤,占所有甲状腺癌病例的80%以上。虽然随着体检的普及,PTC的检出率明显升高,但少数患者会出现远处转移(DM),总体预后显著恶化,10年生存率也从90%下降至40%。 因此,找到一种有效的 DM 风险早期预测方法,对于制定个体化诊疗计划和改善预后
剖宫产子宫瘢痕异位妊娠(CSEP)是剖宫产术后妊娠的一种潜在致命的并发症,可能导致孕妇大出血或死亡。手术中的出血量直接影响手术的成功率。 近年来,基于电子病历(EMR)数据构建的机器学习(ML)预测模型研究日益增多。本研究团队开发的最佳预测模型已被集成到一个网络应用程序中,使临床医生无需掌握R语言或编程技能即可预测CSEP患者的术中风险。 2024年12月,中国学者在医学顶级期刊Lancet子刊《eClinicalMedicine》(医学一区top,IF=9.6)发表了一篇题为:“Risk of intraoperative hemorrhage during cesarean scar ectopic pregnancy surgery: development and validation of an interpretable machine learning prediction model”的研究论文。 在该项研究中,研究团队使用四种方法确定模型的预测因子,并使用八种机器学习法构建预测模型。不同于我们之前介绍的SHAP法,本研究使用"iBreakDown"包对模型进行可视化。
在该项研究中,研究团队使用了去身份化电子健康记录(EHR)数据,纳入老年患者。 本研究旨在基于8种机器学习法和SHAP法,构建可解释机器学习预测模型,以评估风险因素并预测老年心合并高血压患者的住院死亡率。 √缺失数据的处理 研究中所有变量的缺失数据比例均保持在30%以下,使用K-最近邻(KNN)分类算法对缺失数据进行处理。 √变量筛选 使用LASSO法在44个变量中筛选出9个最佳预测因子,包括年龄、住院时间(LOS)、中性粒细胞(Neu)、尿素、Cl、活化部分凝血活酶时间(APTT)、白细胞(LEU)、白蛋白和HDL胆固醇。
Zstats交流群
联系助教
请输入助教告诉您的积分券
如果不填写积分券,将直接使用当前余额支付
请稍候,正在为您生成支付订单
请使用扫描二维码完成支付
二维码获取失败
支付二维码获取失败,请点击重新获取
请稍候,正在为您完成支付
正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付
您的订单已支付完成,页面将在 秒后自动关闭
支付过程中出现错误,请重新选择支付方式