公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

GBD数据库预测2050是怎么做的?有了这个模型你也能发Lancet子刊!

Administrator
发布于 2025-08-27 / 70 阅读
0
0

在众多已发表的GBD(全球疾病负担)研究文章中,大多数学者不限于描述疾病现状,还会加入预测模型以分析未来趋势。今天,我们就来简要介绍如何利用ARIMA模型对GBD数据库进行预测分析。

在已发表的文献中,有很多种预测方法来预测数据,常见的包括贝叶斯年龄周期队列(BAPC)模型,ARIMA模型,nordpred模型等。但在进行未来数据预测时,常常会有人觉得ARIMA模型纳入的数据较少,R语言中计算简单而质疑他的预测能力。

今天我们将以一篇GBD预测文章为例,为大家解读如何用ARIMA模型进行预测。

2024年2月8日,英国伦敦国王学院的作者在《The LANCET Reginal Health-Europe》中发表的题为:“Burden of intracerebral haemorrhage in Europe: forecasting incidence and mortality between 2019 and 2050”的研究论文,旨在使用现有脑出血数据预测2019-2050年的未来发病率与死亡率数据。

本文有两大亮点:第一点为在ARIMA模型中添加了外生变量SDI,共同预测未来数据;第二点为通篇文章使用预测后数据进行描述性统计,与题目相呼应。

接下来本文将从这两点进行简单介绍。

ARIMA模型的外生变量

ARIMA(AutoRegressive Integratd Moving Average)模型是一种用于时间序列分析和预测的统计模型。它结合了自回归(AR)、差分(I)和移动平均(MA)三个部分,用于捕捉时间序列数据的动态特征。

通常情况下,ARIMA模型的建立包括以下步骤:

1. 确定时间序列是否平稳,如果不平稳,则进行差分以获得平稳序列;

2. 通过观察自相关图(ACF)和偏自相关图(PACF)来确定合适的p和q值;

3. 使用拟合的ARIMA(p, d, q)模型对时间序列数据进行预测。

如果要使用ARIMA模型,我们该如何添加外生变量?

从公式的角度来看,仅需在ARIMA模型的计算中再添加一项SDI及其系数,我们就能将把这个公式纳入我们自己的研究。下面是本文学者所使用的公式: 

文章内容

为什么会认为文章内容也是一大亮点呢?

尽管可以参考其他GBD文章,但这篇文章的内容与常规的GBD略有不同,纳入ARIMA模型后,研究团队能在已有数据的基础上进行更为精准的预测,并减少异常值与预测结果的影响,结局更准确。

接下来我们来看简单一下这篇文章的结果,大家可以这篇文章与其他GBD预测文章进行比较:

在下表中,我们列出了欧盟 28 个国家在不同健康情景(参考、更好和更差)下观察到的 2019 年新增脑出血病例数,以及相应的 2050 年预测。

该表还突出显示了 2019 年与 2050 年参考预测之间计数和年龄标准化比率的百分比变化。

表1 2019年和2050年的脑出血病例数量以及按国家划分的数量和年龄标准化率的百分比变化

接着使用1990-2019年数据预测2020-2050年的未来趋势,从下图中我们可以看到,研究团队分别预测了未来的发病人数、死亡人数、粗发病率、粗死亡率、年龄标准化发病率、年龄标准化死亡率。

研究结果表明,如果欧盟国家在社会经济和脑出血危险因素方面经历更糟糕的健康趋势,那么,脑出血风险因素的健康趋势将增加 16.7%。预计到 2050 年(95% UI,8.7%–25.3%),新增患者总数可能达到 163.9(95% UI,141.6-190.3)千人(表 1 ,图 1 )。

图1 欧洲随时间推移的脑出血发病率和死亡率,预测截至 2050 年。ICH 表示脑出血。

相反,如果各国遵循更好的健康轨迹,预计脑出血病例会减少 10%(95% UI,16.4%–2.3%)。

关于死亡率,研究团队的预测结果表明,2050 年将有 144.2 人(95% UI,122.9–172.2)人死于脑出血,与 2019 年相比增加 8.9%。这与该地区自 1990 年以来观察到的 22% 的下降形成鲜明对比(图1 、表2 )。

表2 2019年和2050年脑出血死亡人数以及按国家划分的计数和年龄标准化率的百分比变化

据观察,欧洲女性脑出血的绝对负担略高于男性,且随着年龄的增长,差异显著扩大。一般来说,直到80岁,年龄每增加五年,脑出血病例数就会增加大约三分之一,而死亡率则几乎增加一倍(图2 )。

图2:1990 年、2019 年和 2050 年按年龄和性别分组的脑出血发病率和死亡率参考预测以及欧洲人口结构

尽管每个国家的标准化费率都有所下降,幅度约为五分之一到一半,但大多数欧盟国家的粗率和计数数字要么上升,要么略有下降(图3 、图4 、图5 )。

图3:2019 年至 2050 年欧洲脑出血发病率和死亡率的观察和预测变化。点的大小并不传达具体信息;它用于说明时间序列的方向并在重叠的情况下提高清晰度。国家根据 2050 年预测按升序排列。

下图直观地展示了发病率与死亡率在2019-2050年之间的变化率。

图4:2050 年与 2019 年脑出血发病率和死亡率的百分比变化

分解分析显示了发病人数与死亡人数在危险因素、人口规模、人口老龄化上的占比。

图5:2019年至2050年欧洲脑出血病例和死亡人数百分比变化分解分析。国家根据其总体预测变化按升序排列。ICH表示脑内出血。

综上所述,尽管欧洲在降低脑出血风险和相关死亡率方面取得了相当大的进展,但预计的趋势表明,患有这种疾病并死于这种疾病的人数不断增加。事实上,如果不持续努力加强风险因素的流行和控制并改进治疗方案,脑出血病例数和相关死亡人数可能会恢复到与 20 世纪 90 年代相当的水平。至关重要的是,在人口老龄化导致身体虚弱和合并症增加的背景下,更好地了解风险因素管理,为此类努力提供信息。

结 语

本文最大的亮点就是使用了具有外生变量SDI的ARIMA模型,这样能使预测的误差更小,更加准确。同时在文章内容上,不同于其他预测文章直接呈现1990-2019年的信息,这篇文章将所有的内容都用预测出来的值为基础以各种图表的结果呈现。

不过需要注意的是,使用ARIMA模型要求要求时序数据是稳定的(stationary),或者是通过差分化(differencing)后是稳定的。本质上只能捕捉线性关系,而不能捕捉非线性关系。


评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明