关于有向无环图(directed acyclic graphs,DAGs),我们讲了不少,它是一种有用的工具,可直观地展示变量之间的关系,并帮助阐明所选统计模型背后的因果假设。
我们看到一篇文章,详细介绍了SNAP-3 队列研究中 DAG 的构建过程,发表在《British Journal of Anaesthesia》(医学一区,IF=9.2)杂志上。
针对虚弱、多重共病和谵妄(作为暴露变量)与术后结局(住院时长、谵妄、发病率、死亡率)之间的暴露–结局关系,分别绘制了 DAG。
DAG 的构建遵循“构建有向无环图的证据综合”方法,并在独立临床专家反馈后进行了修订。
下面,一起看看本文构建有向无环图的14个步骤!
第1步:明确研究问题
清晰阐明研究问题,明确暴露变量和结局变量、纳入标准、暴露测量的时间点及随访时间。
在本例中,SNAP‑3 的研究问题是:“虚弱和多重共病如何影响英国老年外科患者的术后发病率?
在 SNAP‑3 中,虚弱通过手术入院时采用的临床虚弱评分进行评估。这里,手术入院即为基线或随访起点。
第 2 步:判断 DAG 是否有助于回答研究问题
如果认为 DAG 有助于回答研究问题,应在研究方案和数据分析计划中明确写入 DAG 的使用。
判断是否需要DAG,以下情况通常适用:
a) 研究为观察性设计,而非随机对照试验;
b) 问题结构为“x 是否导致 y?”,例如抽烟是否导致癌症?;
c) 暴露与结局之间可能有众多混杂变量;
d) DAG可使读者更深刻地了解研究与分析中所做假设。
本研究中,虚弱和多重共病与老年外科患者术后发病率的关系受到众多变量的复杂影响,因此研究者决定为该关系构建 DAG。
第3步:识别影响暴露—结局关系的相关变量
列出所有可能影响暴露—结局关系的潜在变量,包括可测量和不可测量者。
请教领域内其他临床或研究专家,确保重要变量未被遗漏。
通过文献回顾和专家讨论,在图 3 中列出了相关变量,并针对每个节点的定义进行了决策,以最大限度地减少偏倚、混杂、“重复计量”及测量误差。
图 3 有向无环图(DAG),示意虚弱和多重共病与术后发病率之间的关系。
此示例 DAG 在 DAGitty 中展示了虚弱和多重共病(作为联合暴露或交互暴露)与术后(postop)发病率(结局)之间的暴露–结局关系。
联合暴露“虚弱”和“多重共病”以绿色节点(带三角形符号)表示。
两者的交互作用以绿色、带黑色三角形的交互项表示。
结局“术后发病率”以蓝色节点(粗黑垂线)表示。
其他变量节点含义如下:
蓝色节点为结局的祖先;
红色节点为暴露和结局的共同祖先(校正后变为白色);
绿色节点为暴露的祖先;
浅灰色节点为未观测或潜在变量;
深灰色节点为其他变量。
本模型的最小校正集合包括:年龄、恶性肿瘤、痴呆、听力受损、视力受损、性别和社会经济剥夺程度。
第 4 步:绘制图表结构模板
下一个步骤是“绘制”(mapping),将所有影响暴露–结局关系的变量都记录在图中。
绘制时,以所有变量为“节点”,以连线表示所有节点之间的潜在关系,初步构建“饱和”图。
第 5 步:精炼模板图,仅保留因果关系
从完全饱和的图出发,对于不存在已知或可疑关联的节点对,依据变量的时间顺序删除连线。
剩下的连线应当准确反映暴露、结局、协变量、混杂变量与碰撞器之间的因果关系,且不得形成任何环路(DAG 的根本原则是无环),并为剩余连线加上箭头。
例如,“虚弱”在术后测量,并可能导致术后发病率,但反过来则不成立。
在 DAG 中,连线的缺失强烈暗示两个变量之间没有直接关系,而连线的存在则表示可能的因果联系。因此,哪些连线不存在也是图示关键信息。为增强透明度,可将支撑或反对某条连线的文献证据与专家意见汇总于表格。
在建模“虚弱和多重共病与术后发病率”的关系时,有些联系显而易见,例如手术严重程度增高会导致术后发病率增加;有些联系则不太明显,如恶性肿瘤与谵妄的关系,则需查阅文献加以确认。
部分截图
为了降低遗漏或误判真实关系的可能,可采用反事实思考实验:设想在其他条件不变的情况下,某一变量值发生改变时会怎样,以此评估该变量在 DAG 中的直接与间接效应。
例如,考虑“年龄”和“痴呆”二者的关系:显而易见,年龄增大会提高痴呆风险,而痴呆发生并不会改变患者年龄。再如“社会经济剥夺”与“虚弱”的关系:虽然普遍认为社会剥夺因医疗服务可及性降低和不良生活方式等因素而与虚弱相关,但究竟该箭头为何方向并不直观。SNAP‑3 团队经讨论认为,绝大多数证据支持社会剥夺增加了虚弱发生的可能性,故在 DAG 中以单向箭头由“社会剥夺”指向“虚弱”。
第 6 步:变量整合
应当将节点和连线整合,使图中所有存在的关系(连线)和不存在的关系(无连线)都以最简形式记录。
若两个或更多节点具有相同输入和输出,可考虑合并以简化 DAG,并保持一致性。
起初,DAG 中将“听力受损”和“视力受损”作为独立节点,但它们与其他变量(年龄、虚弱、多重共病、痴呆、谵妄)的连线完全一致,故为简化起见可将其合并。因在 SNAP‑3 分析中这两者是独立评估的,故模型中仍保留为分开的节点。
第 7 步:审查与修订 DAG
在修订过程中,将 DAG 分发给领域专家,确保未遗漏变量且已正确识别所有关系。
SNAP‑3 的 DAG 由一组独立专家(麻醉科医师、老年医学科医师、统计学家、外科医师)评审,并提出了若干修改建议。对于补充材料中包含住院时长(LOS)结局的 DAG,外部审阅者建议添加一个未测量的变量“康复及社会服务可及性”。
第 8 步:优化研究设计
利用 DAG 指导最佳研究设计。
特别是力求测量 DAG 中出现的所有变量,以便在回归模型中准确反映。研究者需结合实际可行性与经费约束,仔细斟酌各变量代表的含义及其最准确的测量方法。
观察性研究常见测量偏倚,尤其依赖常规或回顾性数据时更甚。例如,在 SNAP‑3 中,“虚弱”由各中心研究者依协议在入院时用 CFS 前瞻性测量,CFS 在外科人群中验证充分、使用熟悉且易于操作,可最大程度降低测量偏倚。相比之下,“多重共病”定义为预存共病的数量,更易受测量偏倚影响。研究者需依据预定义清单记录共病,并在可能时通过询问患者及查对病历核实,然而仍难免漏记,可能低估多重共病程度。
因“遗传易感性”无法在 SNAP‑3 中测量,该节点在图中用浅灰色标示为“未观测”,以便讨论研究局限。
第 9 步:识别混杂变量
细致检查 DAG 中既影响暴露又影响结局(直接或间接),且不在因果路径上的节点,这些即为混杂变量,如图所示。
在 DAGitty 中,这些混杂节点会被标记为粉红色,连线变为红色,表示存在偏倚路径(若不阻断,将导致因果效应估计有偏)。
在研究“虚弱与多重共病对术后发病率的影响”时,诸如手术严重程度、手术紧急程度、术前门诊评估等均为混杂变量。
第 10 步:确定校正集合
识别并校正混杂变量,对于隔离暴露对结局的因果效应、避免虚假关联及混杂偏倚至关重要。DAGitty 可建议最小校正集合。
一些混杂变量十分明显,如年龄既影响虚弱发生也影响术后发病;另一些则较为隐蔽,如社会剥夺既直接增加虚弱风险,又通过“手术紧急程度”这一中介影响术后发病。
在 DAGitty 中,可将节点标记为“已校正”,其背景色变为白色,连线从红变黑,表明该偏倚路径已被阻断。应选用尽可能少的节点以隔离效应。
可能存在多个最小校正集合,选择时可基于缺失值情况、数据质量或模型参数数量等因素。
若仍无法确定最佳 DAG 或校正集合,可预先规划敏感性分析,对不同模型及其校正集合进行对比,以增强推断的稳健性:
若各模型结果一致,则更可确信所选 DAG 反映了真实关系;
若结果差异显著,则需要进一步探讨并提出新假设。
第 11 步:统计分析
基于所选最小校正集合,采用适当的统计方法(如回归模型),建立暴露–结局关系的统计模型。
SNAP‑3 最终采用多变量回归模型,对所有混杂变量校正,同时避免意外的相互校正和偏倚。
需注意,DAG 本身并不规定如何在模型中具体拟合每个变量,研究者仍需决定变量的建模方式,例如是否为年龄添加二次项等更复杂形式。
第 12 步:结果解读
结合 DAG 及其建议的校正集合,借助统计模型输出,更有信心地评估暴露–结局关系,并以更高透明度报告研究发现,理解分析结果在因果框架下的含义。
第 13 步:结果汇报
报告结果时应附上相关 DAG 并解释其假设与决策,同时附文献支持表格,并说明研究局限(如不可测量或记录不准确的变量)。透明的做法有助于读者全面理解并评估研究,并提供反馈与改进建议。
本论文已展示了用于 SNAP‑3 统计建模的 DAG(图3)。对部分读者而言,可通过示意图简化 DAG,本论文下图即为DAG(图3)的示例。
第 14 步:持续修订有向无环图
随着文献进展不断更新 DAG;如有重大新发现,可重运行分析并更新结果。
SNAP‑3 欢迎其他研究者对所提 DAG 进行进一步完善,以便在其他研究中使用。
DAG可以帮助审稿人和编辑理解一项研究,因为它们明确地展示了研究设计、数据收集和分析背后的假设。
许多实证研究论文隐含地假定了某种因果结构。包含DAG可以使这种潜在的因果结构变得明确,并让读者评估这些假设的合理性。
因此,在同行评审过程中,要求提交这些图表可能会对审稿人和编辑有所帮助。
所以,推荐在你的因果推断研究中,加入DAG。
参考文献:
Swarbrick CJ, Blake HA, Martin P, Partridge JSL, Moppett IK. Directed acyclic graphs to minimise bias and optimise causal inference in SNAP-3: an observational cohort study of frailty, multimorbidity, and delirium in older surgical patients. Br J Anaesth. 2025 Jul;135(1):177-187. doi: 10.1016/j.bja.2025.04.027.