公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

中医药文章再发顶刊!看看多组两两比较统计学方法

Administrator
发布于 2025-08-19 / 53 阅读
0
0

之前我们对我国学者的一篇发表在顶级期刊《Annals of Internal Medicine》(医学一区top,IF=19.6)的一篇中医药临床试验文章进行了解读,同时对其统计学方法展开论述!

该研究是一项为期 24 周的多中心随机对照临床试验,研究团队在四川、贵州、陕西、山西设立4个临床分中心,纳入716例慢性颈痛患者,随机分为高敏化穴(HSA)组、低敏化穴(LSA)组、假穴(SA)组和等待治疗(WL)组。评价针刺治疗颈部慢性疼痛的效果,结局指标为颈部疼痛视觉模拟量表 (VAS) 评分 。

现在我们把它做成一个系列进行解读:

1. 医学院那就统计学方法约复杂越好

2. 多组比较时多重比较应该如何控制假阳性问题?

3. 多组研究设计样本量如何计算?

(如果你需要全文,请在医学论文与统计分析微信公众号后台回复关键词“pdf”。)

在这篇文章中,我讨论多重比较如何控制假阳性。

今天从三个方面详细说说!

1.什么情况下需要进行两两比较?

2.如何进行两两比较?每两组都要比吗?

3.多重比较,如何控制假阳性错误?

1.什么情况下需要进行两两比较?

在医学研究中,方差分析,卡方检验,秩和检验等方法都会碰到多组数据的比较,多组数据比较紧跟着的是两两比较,这是我们最熟知的。

但不只这个,在医学研究上可以包括以下几类:

1)多组数据两两比较

2)多个结局指标比较

3)临床试验的期中分析(2次,3次期中分析)

4)亚组比较(多个人群)

2.如何进行两两比较?每两组都要比吗?

不同情况下,对于两两比较的设计并不相同,是不是多重比较中,每两个都要进行两两比较呢?很显然,并不是这样!

多重比较并不一定要对每一对组别都进行两两比较。在实际应用中,这取决于你的研究设计和具体需求。

  • 如果你只关心特定的几个成对组合,那么就只需要对这些感兴趣的组合进行比较。例如,其他组别都只与对照组进行两两比较;或者你对两个干预组之间是否有差异更感兴趣。

  • 如果你的目标是检测所有组别之间是否存在显著差异,那么确实需要对每一对组别都进行比较,进行全面的两两比较。

但是,超过4组数据多重比较时,不要全部进行两两比较(全部两两比较要进行10次。此时,你想要某一个感兴趣的比较出现阳性结果会很难)。

比如,4组比较,我感兴趣的是1 和 4组有没有差别,但是如果采用全部两两比较时,很难得到1 和 4的差别,因为单次比较的P要小于0.005才有统计学意义。那么怎么办呢?

这时,可以挑选若干组进行比较,采用α分割法控制假阳性错误。比如,4组比较,我就比较1 vs 4,1 vs 3,那么比较两次α=0.05/2=0.025, 即这个时候可以采用t检验,当P<0.025便具有统计学意义。

注意:这种挑选比较的方式,必须在数据分析之前,甚至在科研设计之前,就是必须先设定好,而不是谁有阳性就挑选谁!

3.多重比较,如何控制假阳性错误

临床研究中的多重性(multiplicity)是指在一项完整的研究中,需要经过不止一次统计推断(多重检验)对研究结论做出决策的相关问题。那么就可能会增加假阳性错误的概率,导致I类错误膨胀。

例如,若进行 10 个检验,当无差异假设均为真时,此时假阳性的概率高达 40%

所以,控制假阳性错误显得尤为重要,我们简单介绍几个常用方法:

(1)平行策略多重性调整方法——Bonferroni方法

郑老师:它是保守的方法,但是我还是蛮喜欢用,实际上临床研究很认可。

(2)序贯策略多重性调整方法——Holm 递减方法

(3)序贯策略多重性调整方法——Hochberg递增方法

(4)序贯策略多重性调整方法——固定顺序的检验方法

(5)序贯策略多重性调整方法——回退法

方法介绍我就不过多赘述了,以上可参见本公众号同名视频号中【第9期 临床试验假阳性问题的统计学考虑】。

4. 本案例的多重比较方法

我们所参考的这篇中医药临床试验文章,考虑到多重比较,利用Bonferroni校正(校正P值为0.017)对两两比较进行了校正。

为什么?在本案例中,四组数据的比较如果全部两两比较,需要比较6次,若采用Bonferroni法分割时α=0.008,这显然不利用分析结果,而且干了一些不是研究目的的事情,不仅画蛇添足而且对我们想要评价的主要目的产生严重的影响。

该研究其实想探讨的几个关键比较,所以α/3=0.017,再这样的研究目的下,一般只能讨论高敏化穴相对于其它三组有没有差异,但这样的话,其实没法提供低敏化穴相对假针组、等待组的差异性数据。

The modified intention-to-treat population included 683 participants. The mean baseline VAS was 50.36, 50.10, 49.24, and 49.16 for HSA, LSA, SA, and WL, respectively. Compared with a mean baseline to week 4 change of 12.16 in the HSA group, the mean changes were  10.19 in the LSA group(net difference [ND],  1.97 [95% CI,  5.03 to 1.09]),  6.11 in the SA group (ND,  6.05 [CI, 9.10 to  3.00]), and 2.24 in the WL group (ND, 9.93 [CI, 12.95 to  6.90]).

不过呢,老郑看它具体分析内容,似乎有那么点值得争议的地方,或者多余的内容,有兴趣的朋友可以看看原文。

闲来郑语

其实,不是所有医学研究多重比较都要控制假阳性。

医学研究,有随机对照研究,也有观察性研究,多组比较实际上大多数都不用控制,尤其是观察性研究,因为观察性研究绝大多数是探索性的研究。

只有验证性的随机对照研究才需要,比如3期临床试验。其他的探索性研究,很多临床大夫发起的临床试验,都可以不用控制。

但你得加一句:我的结果是探索性的结果,而不是验证性的。

我们将继续推出统计学细节讲解,继续介绍这篇文章的统计学方法,说到多组比较,你知道临床试验多组比较样本量怎么计算吗?

下一期,我们来一起探讨,敬请关注。


评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明