当你从NHANES数据中得出一个显著的「相关性」时,先别急着下结论。
因为你分析的对象,只是那些“幸存”到接受调查的参与者。
那些因疾病过早离世或病情太重无法参与的人,早已被无声地排除在你的样本之外。这导致了一个核心误区:用“现患病人”得出的结论,去推断“疾病发生”的风险。
这个扭曲研究真相的经典陷阱,就是NHANES横断面分析中最常见也最危险的坑——现患-新发病例偏倚,又称“奈曼偏倚”。
什么是奈曼偏倚?
定义:在横断面研究中,纳入的病例通常是研究时的现患病例,即存活病例,特别是病程较长的现患病例,而难以包括已死亡的病例或尚未发病的潜伏病例,也可能不包括刚发病但迅速康复或死亡的病例,得到的一些暴露信息可能只与存活有关,而未必与该病的发病有关,从而错误地估计这些因素的病因作用。
简单来说,这种偏倚发生在只研究了“存活”到调查时的病例,而忽略了那些因为病情严重已经去世或无法参与调查的病例。
为什么NHANES需警惕奈曼偏倚?
NHANES作为一个典型的大型横断面研究,如同一个时间点的“集体照”,只能记录此刻的状况,无法确定因果时序。
➡️为了便于大家理解,简单举两个例子:
研究疾病与营养的关系:你想研究“低血清白蛋白”是否导致“心力衰竭”。但严重心衰患者常因食欲不振导致营养不良和低白蛋白,且死亡率高。研究中可能仅纳入轻症幸存者,其营养状况较好,从而低估真实关联;
研究某种暴露与癌症的关系:你想研究某个生活习惯和癌症的关系。但某些侵袭性强、进展快的癌症(如胰腺癌)患者难以被纳入研究,样本可能更多包含生存期长的癌症(如前列腺癌)患者,其生活习惯可能相对健康,从而引入偏倚。
如何识别和尽量避免奈曼偏倚?
虽然奈曼偏倚在NHANES研究中无法避免,但我们可以采取以下策略来缓解其影响:
📍审慎定义研究人群与变量 🍃
1.明确研究目标:区分疾病病因(风险因素,偏倚影响大)与疾病负担(患病率及相关因素,影响较小);
2.限制人群或使用替代指标:可限定为新近诊断病例,或采用连续生物标志物(如以HbA1c替代糖尿病诊断)代替二分类结局,以纳入早期疾病信息。
📍转换研究思路 🍃
1.关联纵向数据(最有效策略):将NHANES数据与死亡登记数据库(NDI)等数据库链接,开展前瞻性队列分析,研究暴露与死亡风险的关系,从而规避偏倚;
2.转向生存研究:分析现有病例中某个指标与患者生存质量或预后的关联,而非病因。
📍进行敏感性分析并审慎解读 🍃
1.在讨论中必须主动承认此偏倚的存在,并论证它最可能如何影响你的结果(例如:“本研究可能低估了该风险因素的作用,因其可能导致患者过早死亡而未入选”);
2.将结果与已有队列研究等纵向数据结果进行对比,评估一致性。
END
总而言之,奈曼偏倚是横断面研究设计一个内在的、狡猾的敌人,需要时刻注意!
下一次当你从NHANES中挖掘出一个令人兴奋的关联时,不妨先停下来,问自己一句:“我看到的这个结果,会不会只是因为那些‘没能来拍照的人’?”
保持这种批判性思维,研究才会更加严谨和可靠!