公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

哈哈哈,辣眼睛!一篇造假粗劣的学术论文是怎么样的?

Administrator
发布于 2025-03-21 / 88 阅读
0
0

有个微信朋友发了这么一篇中文的学术文章,是关于logistic回归分析影响因素的报告。我看了下,被逗乐了!这篇文章真是反映了中国当前非卓越期刊的普遍现象----到处是造假文,而且造假也没水平!

我截取该文章的logistic回归分析结果来给诸位看一看:

请大家回答两个问题:

(1) 为什么说这篇文章的logistic回归统计结果是造假的?

(2) 如果不谈造假,只谈规范,回归分析结果有多少处表达不规范?

特别是第二个问题,是值得所有初学者思考的。

我们应如何撰写规范性的logistic回归报告?

我首先来说说规范性的问题。logistic回归是医学研究最常见的回归分析方法,凡是分类结局都可能应用logistic回归,但我发现基本上统计报告在logistic回归的规范性方面,绝大多数作者都有所取欠缺。

规范性表现在图、表和文字,主要是表和文字。上面这一段文字和表有哪些规范性问题呢?

据本人不严谨的统计,有8处需要订正,我在截图上标注了①②③④⑤⑥⑦⑧。

①当结局是二分类结局时,不叫二元logistic回归,可以说二分类logistic回归或者就是logistic回归

②一般的logistic回归根据其分析结果,很难判定那个自变量影响最大,OR值很大不代表该因素影响更大。因为不同变量度量方式不同,不好直接比较。

③这里不叫标准化偏回归系数,是OR值,或者优势比。

④如果自变量对结局有影响,一般情况下文字描述为“某某因素对营养风险的影响存在统计学意义”,或者“某某因素与英有风险存在着统计学关联”。比如,本例可以写为:肿瘤类型与营养风险存在着统计学关联(OR=0.63,95%CI 0.49-0.82,P=0.02)。千万不要因为OR值,写成“肿瘤类型将提升或减少风险多少倍”,这是错误的说法;或者说“肿瘤类型是独立影响因素”(这句话是论文结论而不是统计结果);同时,OR值,95%CI和P值应全部写在文字中。

⑤表格中,如果自变量是分类变量,特别是无序二分类或者多分类,一定要列出各个类别,标明对照组(详细看下面范本)。没有标明对照组的现象是目前回归分析结果统计表规范最大的问题。

⑥P值一般小数位保留3位为妥,且当SPSS给出P=0.000,表格应写成<0.001。

⑦logistic回归给出的是OR值,称之为优势比或者比值比,不是相对危险度;相对危险度是RR值。

⑧一般来说,统计表格中,除了P值,其它值最多保留2位小数。

下面的统计表,相对还凑合,可以参考:

这篇文章的logistic回归结果怎么是造假的呢?

这话应该应该和期刊审稿人说得!logistic回归分析各个指标是是相互联系的。其它不说,就说b值、P值和OR值。

(1)logistic回归的b值(回归系数都很小),但这篇文章的OR值都几十近百了。实在太离谱!

(2)b值和OR值关系非常直接:e^b=OR值,也就是e的b次方就是OR值。您看看,它们是对应的么?

(3) P值和OR值的置信区间是紧密联系的。一般置信区间包括1,P>0.05;置信区间不包括1,则P<0.05;而置信区间上下限越远离1,则P值越小,本篇的置信区间上限远远地离开了1,但P值却还在0.05附近,这是不可能的!

综上所述,这个结果是假的,非常粗劣的假。

在这里,我奉劝一句,诸位,请您尊重数据,尊重学术,不要造假凭你们对统计的认识,造的假一眼会被统计审稿人识破。

也希望大家能够从本推文学到logistic写作规范的要点,这非常重要!

谨以此文,写给坚持学习医学统计学与SPSS的朋友们。


评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明