今天我们来分享一篇JAMA子刊《JAMA Internal Medicine》(医学一区,23.3)的统计与方法学指南,题为:“Covariate-Constrained Randomization”。
这篇文章着重强调协变量约束随机化(CCR)在整群随机临床试验 (Cluster randomized trials,CRT)中的应用。
CCR 方法常能为CRT设计增添严谨性,是控制集群层面关键变量不平衡的高效手段。
整群随机临床试验
整群随机试验 (Cluster randomized trials,CRT) 对基层卫生研究尤为重要,它不再是以个体为单位进行随机抽样和随机分组,而是以人群组为单位进行随机分组。
比如按照初级保健诊所为单位,进行随机化分组为干预组和对照组;一个诊所所有人要么都是干预,要么都是对照。
这种试验类型:
好处是有些时候操作更简单些,不容易受到沾染效应的影响;
缺点是统计分析方法相对复杂,因为个体的之间并不独立,是聚集性数据。
在过去的几十年里,CRT很常见。然而,随着更多CRT的结果被发表,一个严重的方法学问题开始凸显。
与患者级别的随机试验不同,在CRT中,群体级别的随机化单位通常很少,约为10-20个种类(例如实践项目)。由于群体单位如此之少,实践类型、规模、患者人数、文化和护理系统等因素可能产生很大差异。
因此,出现“随机化失败”的情况并不少见,以至于群体在可能影响试验结果(例如卫生服务过程、临床措施)的重要协变量(例如实践规模和人口统计学)方面存在偏差。
这种不平衡会在分析中引入无法测量的混杂因素。简单的随机化方法通常不足以根据重要的患者和实践特征平衡研究组,从而对试验的内部有效性造成潜在影响。
而协变量约束随机化方法是控制集群层面关键变量不平衡的高效手段。
采用协变量约束随机化(CCR)设计的CRT,通过在集群层面(即随机化单位)对可能出现的大规模不平衡进行控制,能比简单随机化方法更有效地平衡研究组之间的重要变量。
如果假定集群层面和个体层面变量相关,通过CCR避免在集群层面的严重随机不平衡,也通常能避免在个体层面(即分析单位)出现严重随机不平衡。
什么是CCR?
CCR 方法会考虑将集群分配到各研究组的所有可能方式,然后只允许其中满足平衡要求的分配方案被选用。
例如,一项研究要比较某项针对诊所的干预与常规护理,且共有 4 家诊所参与,则存在 6 种可能的随机分配方式(见下图 A)。
简单随机化即等概率地从这 6 种分配方式中选择一种。
如果其中 2 家为农村诊所、2 家为城市诊所,且我们认为城乡诊所患者在社会经济、行为特征或其他关键因素上可能存在系统性差异,就可规定“每个研究组中必须各含 1 家农村诊所”,从而排除掉两家农村诊所同组的 2 种方案。此约束会将可选方案从 6 种缩减到 4 种。
CCR 就是从这 4 种“可接受”的分配方案中随机选取 1 种实施。协变量限制随机化以确保可接受的平衡分配,在随机试验设计中由来已久。
随着群组或实践机构数量的增加,其在各研究组间的分配方式会呈指数增长,很难穷尽枚举。例如,若有 30 个机构、在两组中各分配 15 个,则分配方式超过 1.5 亿种。
与其枚举所有可能的组合,研究人员通常模拟许多可能的分配场景——从 1000 到数十万。
研究人员还常常希望同时控制多个集群层面变量的随机不平衡,根据某些阈值或规则来判定(可接受或不可接受)的不平衡程度。
因此,CCR 的步骤包括:
(1)根据研究设计和分配比例模拟大量随机化方案;
(2)对所有模拟方案计算各群组层面变量的不平衡程度;
(3)排除那些在任一预设阈值上超出可接受范围的方案;
(4)从剩余的可接受方案中随机选择一个用于实际随机化。
为什么使用CCR?
相比简单随机化、分层随机化或配对随机化,CCR 在同时控制多个集群层面重要变量的随机不平衡方面更高效。
例如,配对随机化若涉及多变量,则会使配对分析变得复杂,且配对本身会引入组内依赖性。
CCR 能更高效地、同步地控制多个关键群组层面变量的偶然不平衡,并且在许多情况下,还能改善关键患者层面变量的不平衡。通过在这些重要变量上实现平衡,不仅提高了研究组间的可比性(表面效度),也从统计学上提升了试验的效率(检验效能)并减少了干预效应估计中的偏倚。
尽管CCR 相较于更简单的设计具有多重优势,但在CRT 中也存在一些局限。
首先,与较常见的参与者随机化中的序贯随机化不同,CCR 需在试验开始前明确所有集群并收集其约束变量信息,并且在实际中有时难以满足。
当集群入组或识别是分批进行时,需要对CCR方法做调整,但超出本文讨论范围。
此外,CCR 假设所选的群组层面变量与患者层面变量相关,并且对前者的不平衡控制能延伸至后者,但这一假设并非必然成立。
最后,确定可接受不平衡水平具有一定主观性,若设定过于严格,可能导致可用的随机化方案过少,甚至无方案可用。
CCR 方法应用范例
Wolff 等人报道的 SHARING Choices 试验是一项务实的CRT,即为CCR方法合适应用的典范。
该研究将两个医疗系统内的初级保健诊所随机分配到常规护理组或多组分预先护理规划干预组,以评估对记录的临终偏好和潜在过度治疗的影响。
随机化在诊所层面进行,而结果测量在患者层面完成。
研究者使用CCR设计来防止诊所层面重要变量(如地理位置、诊所规模、患者年龄分布和种族构成)出现严重不平衡。在诊所层面控制混杂变量的不平衡,也有助于在患者层面控制混杂变量,从而提高估计干预效果的精确度并减少偏倚。
具体步骤如下:
(1)首先将 55 家诊所分为两层(层内按所属医疗系统分组,其中系统 1 有 20 家,系统 2 有 35 家),然后在每个层内按约 1∶2 的比例进行CCR。
(2)每层分别模拟 1,000 次随机化方案,用地理位置、医生数量、患者平均年龄和黑人患者比例等变量评估每种方案的不平衡程度。
(3)若某方案在任一指标上没有超过预先设定的不平衡阈值,则该方案视为可接受。
(4)最终,系统 1 保留了 79 个“可接受”方案(原始 1,000 个中),系统 2 保留了 41 个,再从各自可接受方案中随机选取 1 个用于试验实施。
(5)研究者在主要结果报告表1中,以描述性统计方式展示了各诊所及其患者的基线特征。
CCR 方法如何解读
需要认识到,不可能在所有潜在影响因素(无论是群组层面还是参与者层面)上实现完全平衡。CCR 作为一种“高级”随机化方法,旨在提高设计严谨性,避免出现重大不平衡,同时仍保留随机分配的核心原则。
从 SHARING Choices 研究主要报告的表 1 可见,两组在机构层面和患者层面特征上都表现出良好的可比性。作者也在研究方案中预先指定了在调整分析和亚组分析中需要考虑的重要患者层面变量。
CCR 应被视为一种对试验设计的“安全网”,是防范群组层面不平衡及其潜在的患者层面连锁效应的保障措施,在提高面效度的同时,也有助于提高估计效应的效率和降低偏倚。
在 SHARING Choices 研究中,CCR 的应用被视为设计的一大优势,增强了研究结论的严谨性与稳健性。
参考文献:
[1]Ciolino JD, Schauer JM, Bonner LB. Covariate-Constrained Randomization. JAMA Intern Med. Published online June 30, 2025. doi:10.1001/jamainternmed.2025.2566
[2]Wolff JL, Scerpella D, Giovannetti ER, et al. Advance Care Planning, End-of-Life Preferences, and Burdensome Care: A Pragmatic Cluster Randomized Clinical Trial. JAMA Intern Med. 2025;185(2):162–170. doi:10.1001/jamainternmed.2024.6215