心房颤动 (AF) 是成人中最常见的持续性心律失常。但据报道,临床上约三分之一患者发作房颤时无明显自觉不适,即无症状房颤。这也导致许多患者因未能及时就医,延误了病情。
2024年12月7日,外国学者用MIMIC-IV 数据库,在期刊《European Heart Journal》(医学一区top,IF=37.6)发表题为:“Prediction of incident atrial fibrillation using deep learning, clinical models, and polygenic scores”的研究论文,研究团队基于深度学习模型(ECG-AI),旨在使用患者的心电图数据开发一个心房颤动(AF)的预测模型。
研究结果表明,ECG-AI在内部验证和外部验证中均表现出良好的预测性能,可准确预测患者心房颤动风险。并且,该模型的预测能力优于现有的其他预测患者是否有AF风险的方法。
(在公共数据库与孟德尔随机化微信公众号后台回复“ 原文”即可获得文献PDF等资料)
一、预测模型的构建与验证
√数据收集与预处理
在该项研究中,研究团队收集了2004 年~2022年间蒙特利尔心脏研究所(MHI)中所有心电图。经过纳排,最终收集了145,323名患者的669,782份心电图,用于模型的构建、验证以及内部测试。
同时,团队还从重症监护医学信息(MIMIC-IV)数据库中获取了109,870名患者的437,323份心电图,对该模型进行外部测试。
异常值处理:团队排除了具有极端电压值(>10mV)的心电图。
主要结局:5年内AF的发生情况。
图1 研究人群的筛选流程
图2 研究流程
√模型的构建
在排除异常值后,研究团队按照7:1:2比例,将剩余的数据划分训练集、验证集和测试集。模型的构建过程如下:
团队使用四个A6000 GPUs(NVIDIA、Santa Clara、CA、USA),在训练集上对单个随机权重初始化的ResNet-50模型进行了训练;
通过贝叶斯网格搜索方法在验证集上优化超参数;
根据最低损失选择验证集中表现最好的模型,然后,在内部 MHI 测试集中的三个子组上报告该模型性能,即 “MHI All-Comers”、“MHI Hospitalized” 和 “MHI Biobank”。
√模型的评估
研究团队使用多个指标评估模型性能,包括区分度、校准度和受试者工作特征曲线下面积(AUC-ROC)等。
研究结果显示,ECG-AI模型具有较好的预测性能:
内部测试的结果显示,ECG-AI模型的AUC-ROC为0.78;
外部测试的结果显示,ECG-AI模型的AUC-ROC为0.77。
图3 外部验证
此外,研究团队还进一步将ECG-AI模型与其他预测方法进行比较,结果表明,该模型的预测能力优于现有的其他预测方法。具体结果如下:
ECG-AI模型(AUC-ROC=0.76)的预测性能优于现有的临床预测评分——老龄化和基因组流行病学研究队列-心房颤动(CHARGE-AF) 评分以及多基因评分(PGS)。
同时,团队还发现在ECG-AI中加入PGS和CHARGE-AF能够提高模型的拟合优度 ,此时AUC-ROC的变化(从0.76变化至0.77)最小。
图4 MHI Biobank测试集中,模型的性能评估结果
√模型的解释
利用TensorFlow的GradientTape,团队计算了模型预测相对于输入ECG样本的梯度,从而得到了一个显著性图。该图突出了ECG信号中最具影响力的部分,从而提供了可解释性。
研究结果如图所示,显著性图突出显示了P波区域对模型预测的影响最大。而信号伪影和异位搏动对其影响较小。
图5 显著性图
二、生存分析
此外,为了模拟具有最长随访时间的预期部署方案,研究团队还进一步进行了生存分析。
结果显示,在长达15年的随访时间中,ECG-AI预测的AF高风险患者(即预测概率≥12%),发生AF的概率要显著高于ECG-AI预测的AF低风险患者。
图6 生存分析
综上所述,本研究开发深度学习(ECG-AI)预测模型可准确预测患者的心房颤动风险,预测性能较好。
亮点小结
MIMIC数据库作为一个重症病数据库,可以说是重症科临床医生的科研加速器。但是对于非此专业,但想挖掘此数据库发文的来说,还是存在一些压力。
但机器学习的出现,可以帮我们攻克这个数据库。无论是像本文一样仅用这个数据库做外部验证,还是用该数据库不同的数据集进行模型构建和内外部验证,都是一篇优秀的文章。