公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

注意注意!你开展的统计分析,可能并不是因果推断研究

Administrator
发布于 2025-07-10 / 11 阅读
0
0

很多时候,开展临床、护理研究,通过一项调查或者最终研究,我们当然你希望去探讨因果关系。但是,很多时候,流行病学研究不仅仅是因果关系研究,也可能是描述性研究或者预测研究。

在这种情况下,如果我们开展了一箱基于回归分析的研究,通过分层或者多变量回归控制了“混杂”,那就可以说是“独立的影响因素”,视为具有因果关系吗?

《European Stroke Journal》杂志的一篇Review article的说,我们在通过分层或矫正所谓“混杂”的时候,要谨慎,要根据流行病学的任务来决定是否需要矫正。

这篇评论文章为卒中研究人员对基于观察性数据的描述性流行病学和因果推断研究,提供了十个需要考量和实施的重要要点,以确保的有效性和可解释性。但由于篇幅太长,只能陆续分享整篇文章。

今天我们分享第八点,观察性流行病学研究中是不是都需要分层与校正?

要点回顾

第一点:就是要考虑您将使用的数据类型是专门为研究而收集的数据,还是为行政和临床目的(但非特定研究目标)常规收集的健康数据。

第二点:是要考虑您的研究问题类型是因果关系还是描述性流行病学?

第三点:基于观察性数据的因果推断

第四点:各种因果效应类型

第五点:描述性流行病学与因果推断研究中的偏倚概述

第六点:使用目标模拟试验方法定义因果效应

第七点:用于阐明和传达因果假设及最小化偏倚的有向无环图

10点入门:如何规范使用观察性数据进行描述性流行病学和因果推断研究

如何利用观察性健康数据,成功回答因果推断问题?

做对这件事,观察性研究也能媲美 RCT!

一文搞懂医学研究因果推断中的有向无环图(DAGs)


第八点:观察性流行病学研究中的分层与校正

有这样一篇文章,审稿人建议他们在原分析中考虑一系列相关且尚未纳入的因素(混杂因素/协变量),构建多变量回归模型,以对此前感兴趣的估计值进行校正。

举例

Garcia‑Esperon 等人利用 INSPIRE 注册库数据评估了基线缺血核心体积 > 70 ml 的患者接受血管内取栓术(EVT)与功能预后的关系。作为同行评审过程的一部分,他们收到某匿名审稿人的以下建议:

【正如作者所指出的,与未接受 EVT 的患者相比,接受 EVT 的患者年龄显著更轻,卒中发作至 CT 的时间更短,既往 mRS 评分更低,基线 ASPECTS 中位数评分显著更高,核心体积中位数更小、半影区更大,且颈内动脉病变比例更低。

鉴于本研究是比较接受 EVT 与未接受 EVT 的患者,EVT 组卒中发作至 CT 时间更短、基线 ASPECTS 评分更高、核心体积更小、半影区更大,可能是因为对 EVT 组的 CT 检查更早进行,但无法确定这些差异是否仅源于此。

匿名意见强调,这些基线影像学特征是可能影响临床预后的重要混杂因素,除了年龄外并未纳入多变量分析。

为解决此问题,建议作者作为敏感性分析,进一步进行多变量分析,至少包括基线核心体积和颈动脉闭塞情况】

为进一步说明,应澄清以下三点:

  • 根据第 2 点对描述性流行病学/关联性研究目的的定义,研究者旨在比较基线缺血核心体积 > 70 ml 的患者在实际接受(EVT 组)与未接受(非 EVT 组)治疗条件下功能预后的分布;

  • 如第 3 点所述,在因果推断研究中,“混杂”指暴露对结局的效应与其他因素(或因素集合)的效应混合在一起,导致真实关系失真(即关联是虚假的);

  • 在回归模型中纳入所有重要因素(除暴露变量 EVT 外)可以获得“校正”估计值。广义而言,“校正”(亦称“控制/条件化”其他变量,或对离散变量进行分层)是指在保持其他自变量不变的条件下,估计感兴趣的效应。虽然本例中采用回归模型实现校正,但任何能够“固定”协变量值的方法——如分层、样本选择或匹配——均可用于此目的

综上,匿名审稿人的建议实质上是要求一个原本具有纯粹描述性流行病学/关联性研究目标的研究,转而估计一个经过若干重要混杂因素“校正”后的关联效应。

鉴于该研究明确的描述性关联性目的,是否应当采纳此建议?毕竟,审稿人提及的各因素似乎均与结局相关且合乎逻辑。

实际上,在此情境下采纳审稿建议并不合适,理由至少有三:

  • 第一:如第 2 点所述,描述性流行病学/关联性研究与因果推断研究在根本上有所不同。混杂是因果概念,与关联性研究无关。

    正如 Hernán 所强调:“除非我们把‘虚假关联’一词用于指无法做因果解释的关联,否则不存在‘虚假关联’——若是如此,则分析目标本应是因果,而非关联。”

    本研究既定的观察性分析目标纯属关联性,不需校正混杂。在本例中,研究者仅需从数据中量化 EVT 与功能预后的关联;其临床解释受限,但统计估计纯粹是关联性的。

  • 第二:任何统计关系都可能受其他变量影响。与普遍认为“统计校正只能帮助避免虚假关联”相反,如第 7 点所讨论,若无适当的方法论基础,使用这种调整实际上会增加引入无意义关联的风险,例如意外打开碰撞路径并创建虚假的关联

  • 第三:如 Fox 等所述,调整诸如地理区域等“标志性”变量,可能“校正掉”决定人们居住地的社会经济因素(如收入),以及这些因素对区域居民健康的影响(如健康食品或医疗服务的可及性)。对于描述性研究而言,不恰当的校正反而会掩盖健康差异的真实幅度。

那么,描述性流行病学/关联性研究中是否完全没有分层或校正的空间?

并非如此!

当某些变量已知与结局预后密切相关且其分布在人群间存在差异时,对这些变量进行校正或分层,可用于评估不同患者群体间的异质性或识别高风险人群。例如,Garcia‑Esperon 等人在估计 EVT 与 3 月 mRS 结局的关联时,就预先指定校正了年龄、既往 mRS 及 NIHSS 评分等已知预后协变量。

需再次强调:

  • 任意、无规划地分层/校正,风险同样极高,可能产生无意义的关联。

  • 选择用于分层或校正的变量必须以理论和研究背景为依据;对因果推断研究尤为重要(见第 7 、9 点)。

描述性/关联性研究应有清晰的分析方案,否则易导致执行混乱、解释含混,既非纯描述亦非因果,典型例子为标榜“危险因素”分析的研究。譬如 Fekadu 等人在埃塞俄比亚 Jimma 大学医中心卒中单元入院患者中研究卒中危险因素、临床表现及预测指标,因将多种研究目标混为一谈,采用向后逐步选择的多变量逻辑回归模型辨识“危险因素”,其方法对某些选取预测变量的研究目标或许可行,但无法为关联或因果问题产生有意义的结论。

总结:

  • 在描述性流行病学/关联性研究中,分层或校正并不等同于“混杂控制”,因为混杂对关联性研究无关;

  • “虚假关联”一说亦无意义——任何关联都会受其他变量影响,仅在赋予因果意义后才可谈“虚假”。

  • 是否分层/校正,须由研究目标驱动;若仅为应对混杂可能性而做校正,实无必要。

建议 8.1:在描述性流行病学研究中,不应使用旨在控制混杂的多变量分析。

建议 8.2:在描述性流行病学研究中,是否分层/校正应由研究目标和研究问题决定;任何校正均须事先有充分理由并在报告中详述“校正后”结果的含义。


评论