刘老师难得写了一篇文章,我抓紧拿过来转载下哈哈。这篇文章是个病例对照研究,我经常有人问两组人数差别太悬殊,是不是结果不可靠,是不是不能用回归,而应该用倾向得分方法。
其实也不是。
我们来解读今天的文章吧,186例病例和6134名对照。也同样是可以是一个很好的研究。发表JAMA Neurol 杂志上。
一、文章整体介绍
题目 肥胖女性患脑静脉血栓的风险
重要意义: 肥胖是下肢深静脉血栓和肺栓塞的危险因素。然而,至今尚无研究评估肥胖是否与成人脑静脉血栓(CVT)有关。
研究目的: 评估肥胖是否为CVT的危险因素。
研究设计与研究对象: 该研究为一项病例对照研究,对象为2006年7月1日(阿姆斯特丹)和2009年10月1日(伯尔尼)至2014年12月31日期间,连续收治于荷兰阿姆斯特丹学术医疗中心或瑞士伯尔尼Inselspital大学医院的成人CVT患者。对照组由荷兰进行的一项大型病例对照研究——静脉血栓形成风险的多重环境和遗传评估研究(MEGA研究)的对照人群组成。数据分析时间为2015年1月2日至7月12日。
肥胖通过体质指数(BMI)来确定。BMI 30或以上被认为肥胖,BMI 25至29.99被认为超重。对于缺失数据,采用多重插补进行处理。研究调整了性别、年龄、癌症史、种族、吸烟状态和口服避孕药使用等因素。以正常体重(BMI <25)的个体作为参考类别。
研究结果: 研究包括186例病例和6134名对照。与对照组相比,病例年龄更小(中位年龄40岁对比48岁)、女性比例更高(133例[71.5%]对比3220例[52.5%])、更常使用口服避孕药(97例[72.9%]对比758例[23.5%]的女性)以及更频繁有癌症史(17例[9.1%]对比235例[3.8%])。肥胖(BMI ≥30)与CVT风险增加有关(调整后的比值比[OR],2.63;95% CI,1.53-4.54)。按性别分层分析显示,女性中CVT与肥胖之间存在强烈关联(调整后的OR,3.50;95% CI,2.00-6.14),但在男性中则没有(调整后的OR,1.16;95% CI,0.25-5.30)。进一步分层分析揭示,在服用口服避孕药的女性中,超重和肥胖与CVT风险的增加呈剂量依赖性关联(BMI 25.0-29.9:调整后的OR,11.87;95% CI,5.94-23.74;BMI ≥30:调整后的OR,29.26;95% CI,13.47-63.60)。在未使用口服避孕药的女性中未发现关联。
结论:肥胖是使用口服避孕药的女性CVT的一个强烈危险因素。
二、该文章的优缺点
优点:
1.明确的研究目的: 研究旨在评估肥胖是否为成人CVT的危险因素,特别是与使用口服避孕药的关联,这是一个临床上重要的问题。
2.详细的数据分析: 研究使用了多重插补程序来处理缺失数据,并进行了多变量逻辑回归分析,以调整潜在的混杂因素。
3.临床相关性: 研究结果对于临床医生在为肥胖女性开具口服避孕药时考虑潜在风险具有重要意义。
缺点:
1.研究设计限制: 作为一项病例对照研究,无法确立因果关系,只能提供关联性证据。回忆偏倚的可能性存在,尤其是在病例组中可能高估了某些暴露因素。
2.样本选择: 研究的病例和对照组来自特定的医疗中心,可能不完全代表一般人群,这可能限制了研究结果的外推性。
3.时间差异: 病例和对照组的招募时间存在差异,这可能导致了时间相关的偏倚,例如肥胖流行趋势的变化。
4.BMI的测量: 使用自我报告的身高和体重数据来计算BMI可能不如直接测量准确,尽管先前研究表明自我报告与实际测量之间有很好的相关性。
5.未测量的混杂因素: 尽管研究调整了多个已知的潜在混杂因素,但仍有可能存在未测量或未被识别的混杂因素,这可能影响结果的解释。
6.遗传性血栓形成倾向未考虑: 研究未能考虑遗传性血栓形成倾向(如凝血因子突变)的影响,这可能是肥胖与CVT关联的一个重要因素。
7.结果解释: 虽然研究结果显示肥胖女性使用口服避孕药时CVT风险显著增加,但绝对风险仍然较低,这需要在解释和传达研究结果时谨慎处理。
总的来说,这篇研究提供了有价值的见解,特别是关于肥胖和口服避孕药使用对女性CVT风险的影响。然而,研究设计和实施中的一些局限性需要在未来的研究中加以解决,以便更准确地理解这些关联。
三、病例和对照样本量差距较大
病例组与对照组的样本数量存在显著差异,这可能对研究结果的解释产生一定的影响。这种差异可能带来的影响:
1.统计效能: 较大的对照组可能增加研究的统计效能,使其能够检测到较小的风险增加。然而,如果病例组样本量过小,可能会导致研究效能不足,无法检测到真实存在的风险差异。
2.选择偏倚: 病例对照研究中的选择偏倚是指病例组和对照组的选择方式可能导致结果的偏差。在这项研究中,对照组的样本量较大,如果对照组的选择能够很好地代表总体,那么这种偏倚的风险可能较低,但病例组导致的选择偏倚不容忽视。
3.结果的外推性: 过大的样本差异可能影响结果的外推性。如果对照组的样本量远大于病例组,可能会导致研究结果难以推广到更广泛的人群中。
4.分析方法: 研究中使用了多重插补方法来处理缺失数据,这是一种适当的方法,可以减少由于数据缺失导致的偏倚。然而,如果缺失数据主要集中在病例组,可能会影响结果的准确性。
5.混杂因素的控制: 研究中对多个潜在的混杂因素进行了调整,这有助于减少这些因素对结果的影响。但是,如果对照组的样本量足够大,可能会更好地控制这些混杂因素,从而得到更准确的风险估计。
6.结果解释: 在解释结果时,研究者需要考虑到样本量差异可能带来的影响。例如,如果病例组的样本量较小,那么即使是统计学上显著的结果也可能受到偶然因素的影响。
总的来说,虽然病例和对照人数差距过大可能会带来一些潜在的问题,但研究者通过适当的统计方法和分析策略可以尽量减少这些问题的影响。此外,这项研究的结果与现有的文献和生物学机制相一致,这增加了其发现的可信度。然而,在解释和应用这些结果时,仍需谨慎,并考虑到可能存在的局限性。未来的研究应考虑使用更大的病例组样本,以进一步提高研究结果的可靠性和外推性。
四、样本量差距较大应该用什么方法?
样本量悬殊,是否需要用倾向得分方法,比如倾向得分匹配?我觉得时髦东西不一定合适,像这篇文章的数据,反而是回归更好,倾向得分匹配将浪费太多太多的个体数据。