公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

痛击NHANES数据分析最大的问题-奈曼偏倚,让研究少走十年弯路!

Administrator
发布于 2025-08-21 / 3 阅读
0
0

当你从NHANES数据中得出一个显著的「相关性」时,先别急着下结论。

因为你分析的对象,只是那些“幸存”到接受调查的参与者。

那些因疾病过早离世或病情太重无法参与的人,早已被无声地排除在你的样本之外。这导致了一个核心误区:用“现患病人”得出的结论,去推断“疾病发生”的风险。

这个扭曲研究真相的经典陷阱,就是NHANES横断面分析中最常见也最危险的坑——现患-新发病例偏倚,又称“奈曼偏倚”

什么是奈曼偏倚?

定义:在横断面研究中,纳入的病例通常是研究时的现患病例,即存活病例,特别是病程较长的现患病例,而难以包括已死亡的病例或尚未发病的潜伏病例,也可能不包括刚发病但迅速康复或死亡的病例,得到的一些暴露信息可能只与存活有关,而未必与该病的发病有关,从而错误地估计这些因素的病因作用。

简单来说,这种偏倚发生在只研究了“存活”到调查时的病例,而忽略了那些因为病情严重已经去世或无法参与调查的病例。

为什么NHANES需警惕奈曼偏倚?

NHANES作为一个典型的大型横断面研究,如同一个时间点的“集体照”,只能记录此刻的状况,无法确定因果时序。

➡️为了便于大家理解,简单举两个例子:

  • 研究疾病与营养的关系:你想研究“低血清白蛋白”是否导致“心力衰竭”。但严重心衰患者常因食欲不振导致营养不良和低白蛋白,且死亡率高。研究中可能仅纳入轻症幸存者,其营养状况较好,从而低估真实关联;

  • 研究某种暴露与癌症的关系:你想研究某个生活习惯和癌症的关系。但某些侵袭性强、进展快的癌症(如胰腺癌)患者难以被纳入研究,样本可能更多包含生存期长的癌症(如前列腺癌)患者,其生活习惯可能相对健康,从而引入偏倚。

如何识别和尽量避免奈曼偏倚?

虽然奈曼偏倚在NHANES研究中无法避免,但我们可以采取以下策略来缓解其影响:

📍审慎定义研究人群与变量 🍃

1.明确研究目标:区分疾病病因(风险因素,偏倚影响大)与疾病负担(患病率及相关因素,影响较小);

2.限制人群或使用替代指标:可限定为新近诊断病例,或采用连续生物标志物(如以HbA1c替代糖尿病诊断)代替二分类结局,以纳入早期疾病信息。

📍转换研究思路 🍃

1.关联纵向数据(最有效策略):将NHANES数据与死亡登记数据库(NDI)等数据库链接,开展前瞻性队列分析,研究暴露与死亡风险的关系,从而规避偏倚;

2.转向生存研究:分析现有病例中某个指标与患者生存质量或预后的关联,而非病因。

📍进行敏感性分析并审慎解读 🍃

1.在讨论中必须主动承认此偏倚的存在,并论证它最可能如何影响你的结果(例如:“本研究可能低估了该风险因素的作用,因其可能导致患者过早死亡而未入选”);

2.将结果与已有队列研究等纵向数据结果进行对比,评估一致性。

END

总而言之,奈曼偏倚是横断面研究设计一个内在的、狡猾的敌人,需要时刻注意!

下一次当你从NHANES中挖掘出一个令人兴奋的关联时,不妨先停下来,问自己一句:“我看到的这个结果,会不会只是因为那些‘没能来拍照的人’?”

保持这种批判性思维,研究才会更加严谨和可靠!


评论