2025年7月26日,安徽医科大学附属第一医院鲁明典副主任医师团队开发一种非侵入性诊断工具,将中医舌诊特征与机器学习(ML)方法相结合,以提高胃癌的早期检测率,研究成果发表在《European Journal of Surgical Oncology》(医学二区,IF=2.9)杂志。
主要研究设计
本研究于 2024 年 2 月至 8 月期间,在安徽医科大学第一附属医院前瞻性招募了292名受试者,其中包括 146 例经组织学确诊的胃腺癌患者和 146 名无恶性胃病变的对照者。
为减少人口学变量的混杂影响,采用最邻近法倾向性评分匹配(caliper=0.05,1∶1 配比),以年龄和性别为匹配因子。匹配后,纳入 146 例胃癌组和 146 例非胃癌组进行后续分析。
舌象特征差异显著
在胃癌组(GC,N=146)与非胃癌组(NGC,N=146)之间,舌象特征存在显著差异。
表1 GC组与NGC组舌部特征比较
这些发现提示GC患者具有独特的舌象特征,支持其作为非侵入性诊断指标的潜力。
部分舌象特征与胃癌密切相关
GC状态与糜烂(r=0.72)、舌面有刺点(r=0.47)、灰黑舌苔(r=0.44)及出血(r=0.44)呈强正相关;
与齿痕舌(r=0.34)、舌体肿胀(r=0.31)、裂纹舌(r=0.29)也存在中等程度正相关。
GC与脱落舌苔(r=–0.22)、小舌(r=–0.20)、胆汁返流(r=–0.33)及息肉(r=–0.14)呈负相关。
舌苔颜色与厚度高度共线(r=0.99),提示二者可能存在冗余。
图1 临床与舌象特征的相关性热图
这些结果强调了与GC密切相关的关键舌象特征,支持其作为非侵入性指标的可行性。
机器学习预测模型开发与验证
1.特征筛选
为识别对胃癌(GC)最具信息量的预测因子,采用 LASSO 回归进行特征选择,通过交叉验证确定惩罚参数 λ 以最小化二项偏差,保留非零系数特征共12项。
包括年龄、舌面有刺点、裂纹舌、舌体肿胀、灰黑舌苔及 CA19-9 水平等。
上述筛选特征被用于后续机器学习模型的构建,为分类性能优化提供了精炼且可解释的基础。
2.模型构建
采用七种机器学习(ML)算法——逻辑回归、决策树、随机森林、LightGBM、XGBoost、支持向量机(SVM)和梯度提升决策树(GBDT)——来构建胃癌(GC)的预测模型。
3.模型性能评估
在训练集上,GBDT、LightGBM 和 XGBoost 等集成模型实现了完美分类性能(AUC=1.000;F1 ≥0.985)。
在测试集上,GBDT 依旧表现最佳(AUC=0.980;F1=0.932),其次为随机森林和 XGBoost。
模型可解释性通过 SHAP 分析得到增强,结果显示 AFP、CA125、CA19-9、CEA 等肿瘤标志物对模型输出影响最大,裂纹舌、舌体肿胀、齿痕舌及舌面有刺点等舌象特征亦贡献显著。
综合来看,GBDT 在训练与测试数据集上兼具稳定性与高准确性,是最适合的非侵入性 GC 预测模型。
老郑小评
舌诊是中医辨证的重要工具,是通过观察舌头的形态、颜色、苔质等变化来判断身体状况的独特方法。
本研究证明了将舌象特征与机器学习相结合,用于非侵入性胃癌筛查的可行性。
另外,胃癌患者所呈现的典型舌象——如蓝紫舌、裂纹/肿胀舌及灰黑舌苔——与中医“瘀血”致病理论相一致。这些结果亦印证了既有研究指出舌象可反映全身病理变化,尤其是胃肠道疾病。
中医药研究结合先进的统计学方法,用数据“说话”,拿出硬证据,是中医药走向国际,为中医药正名的一条通路。
不过,我就思考两个问题:1.这效果能有这么好?我觉得还要经受外部验证才能进一步论证模型的效果;第二,预测模型倾向得分匹配是否可以?我建议各位预测模型不要在倾向得分匹配基础上进行。3.我感觉这个模型呀,主要还是癌症指标的作用AFP、CA125、CA19-9、CEA ,舌诊诊断的效果更多是锦上添花吧。4.要我说,有些文章拿所谓中医现代化仪器来把中医文化都搞没了喽。
参考文献:
Tian P, Chen Z, Fang B, Wang X, Yu X, Lu M. Investigating the relationship between tongue diagnosis features and gastric cancer: A machine learning-based prediction model. Eur J Surg Oncol. 2025 Jul 26;51(10):110352. doi: 10.1016/j.ejso.2025.110352