我们今天介绍的亚组分析,不仅仅是普通的亚组分析的概念了! 我们称之为处理效应的异质性(HTE),它是指同一干预或治疗在不同患者中可能产生的反应差异。
现在,是该了解 "处理效应异质性"(HTE)的概念与方法的时候了
HTE 通常通过传统的亚组分析来检验,该分析“每次只按一个变量”对比不同患者组之间的效应(例如男性与女性或老年与年轻)。
目前,也有新的方法出现,实际上是对传统亚组分析进行了拓展,例如通过统计建模或复杂特征组合确定各亚组的治疗效果。
我们来看看另外一个亚组分析的概念,CATE;这里又得讲讲两个概念,ATE (Average Treatment Effect : 平均处理效应): 是整个研究人群中,接受治疗(或干预)与未接受治疗(或干预)的结果之平均差异;CATE (Conditional Average Treatment Effect : 条件平均处理效应): 是在特定子群体(基于某些特征或条件划分)中,接受治疗(或干预)与未接受治疗(或干预)的结果之平均差异。
CATE,精准医学时代,大家需要理解的亚组新概念了。
现在在处理效果的异质性研究中,亚组的定义或划分通常有三种方式:
传统的临床变量,如BMI或性别(即传统的亚组分析);
结局在基线时的预测风险(对应风险建模的方法);
或治疗的预测益处(对应效应建模的方法)。
这三种方法均可以在医学文献中见到。
基于临床常见变量分类划分亚组
通过传统亚组分析,可以评估在所有患者中观察到的治疗效应是否一致,或患者群体在不同人口学、生物或疾病特征上是否存在治疗效应的异质性(HTE)
示例
中山大学附属第一医院重症医学科管向东教授团队在医学顶刊《BMJ》杂志上发表的一项探讨免疫调节剂胸腺肽α1(thymosin α1)能否降低成人脓毒症患者的死亡率的临床随机对照研究中,主要结局是随机分组后28天的全因死亡率。
亚组分析结果显示,胸腺素α1对不同年龄和不同慢性病的亚组参与者的疗效存在差异。在胸腺素α1组中,60岁以下参与者的28天死亡率更高;而对于慢性疾病,糖尿病、高血压和冠心病的患者,胸腺素α1组的患者的28天死亡率低于安慰剂组。
参考文献:Wu J, Pei F, Zhou L, Li W, Sun R; TESTS study collaborator group. The efficacy and safety of thymosin α1 for sepsis (TESTS): multicentre, double blinded, randomised, placebo controlled, phase 3 trial. BMJ. 2025 Jan 15;388:e082583. doi: 10.1136/bmj-2024-082583.
关于亚组分析的文献和指导内容丰富(且大多持批评态度)。尽管如此,亚组分析仍然经常被报告,通常以森林图的形式呈现。亚组分析最重要的是预先设定与结果解读需谨慎。
根据结局的预测风险划分亚组
该方法对应上期介绍的“风险建模”方法,根据结局在基线时的预测风险来划分亚组。通常分两步进行。
首先,从外部来源选取(即“外部模型”)或在试验人群(即“内部模型”)中开发(不包含治疗分配项)的多变量回归模型,以预测结局风险。
接着,将该模型用于试验人群分层,并检验基于风险层次的治疗效应差异。
我们可以认为,当相对风险降低保持不变时,绝对风险更高的患者将获得更大的绝对风险降低。
示例
一项研究考察颈动脉内膜切除术对缺血性卒中的预防效果,发表在顶刊《Lancet》杂志,研究者利用“欧洲颈动脉手术试验”的数据,建立了一个模型预测患者30天卒中风险,另一个模型预测手术并发症风险。
基于这些模型,研究者开发了一个预后评分,以识别在医疗治疗下有较高卒中风险但在手术方面风险较低的患者。
结果显示,基线时预测为30天卒中风险高且手术并发症风险低的患者中,颈动脉内膜切除术可降低这类患者的5年缺血性卒中和死亡风险。
参考文献:Rothwell PM, Warlow CP. Prediction of benefit from carotid endarterectomy in individual patients: a risk-modelling study. European Carotid Surgery Trialists' Collaborative Group. Lancet. 1999 Jun 19;353(9170):2105-10. doi: 10.1016/s0140-6736(98)11415-0.
这种方法本质上简化了多重预测因素HTE分析,并自然地使用风险评分进行HTE估计的降维。
根据预测的治疗效果划分亚组
根据预测的治疗效果划分亚组,对应我们上期所讲的“效应建模”方法。
效应建模一种预测异质治疗效果的分析方法,直接在试验数据上建立模型以预测治疗效果(即,在两种替代治疗条件下结果风险的差异)。
直接针对治疗效果进行估计在统计上颇具挑战性,因为需要进行 2 次预测,一次用于对照组,一次用于治疗组。
为了解决直接估计 HTE 时固有的高维问题,一种新的解决方案是进行效应评分分析,通过这种方法可以根据一组基线特征灵活地预测治疗效果,然后在不同效应评分下检查治疗效果(HTE)的差异。
因此,效应评分分析类似于风险建模方法,只是使用效应评分代替了预后评分。
用于估计治疗效应评分的有前途的策略包括因果森林、基于 lasso 的算法等,以及未来随着预测建模的研究而可能出现的更多方法。
示例
在一项发表在JAMA主刊,探索肝素治疗COVID-19住院患者的研究中,研究者除了使用上述两种方法进行亚组分析,还使用第三种方法:机器学习方法(Causal Forest,因果森林)来探索治疗效果的异质性。
然而,研究者使用的这种模型并未发现预测获益与治疗效果的明确关联,相比传统亚组分析所提供的额外信息很有限。
参考文献:Goligher EC, Lawler PR, Jensen TP, et al. Heterogeneous Treatment Effects of Therapeutic-Dose Heparin in Patients Hospitalized for COVID-19. JAMA. 2023;329(13):1066–1077. doi:10.1001/jama.2023.3651
一项发表在NEJM Evidence杂志上的TOPCAT试验中,探索治疗效果的异质性时,选择了第三种方法。研究者以随机森林的一种改良方法——因果生存森林(causal survival forests)作为主要方法。
研究结果证明了螺内酯的治疗效果随预测获益的四分位数而变化,除了证明螺内酯治疗效果的异质性外,研究还确定了异质性的关键预测因素(例如BMI)。
参考文献:Desai RJ, Glynn RJ, Solomon SD, Claggett B, Wang SV, Vaduganathan M. Individualized Treatment Effect Prediction with Machine Learning - Salient Considerations. NEJM Evid. 2024 Apr;3(4):EVIDoa2300041. doi: 10.1056/EVIDoa2300041.
老郑小评
亚组分析是研究处理效应异质性的传统方法。后续提出的替代方法——“预测性HTE分析”(包括“风险建模”和“效应建模”),其实也可以看做亚组分析的拓展方法。
今天是本系列的第二篇,带诸位了解一下常见方法的概念和示例,后续还可以再讲讲这些方法该如何选择?以及机器学习方法,随机森林与因果森林等。
欢迎关注进展!