第100+6步 ChatGPT文献复现:ARIMAX预测新冠

基于WIN10的64位系统演示

一、写在前面

我们继续来解读ARIMAX模型文章,这一轮带来的是:

《PLoS One》杂志的2022年一篇题目为《A data-driven eXtreme gradient boosting machine learning model to predict COVID-19 transmission with meteorological drivers》文章的公开数据做案例。

这文章做的是用:使用Xgboost结合天气数据预测新冠。

题目里没说ARIMAX模型,实际上它在文章中被作为对照组。

二、闲聊和复现:结果一描述性分析

1全文技术路线

① 收集天气相关的数据,比如气温、湿度、降雨量、风速和气压。作者认为这些天气情况可能会影响病毒的传播。

② 使用了两种不同的统计模型来分析数据和做出预测:ARIMAX和XGBoost。

③ 将模型输出的预测数值与实际发生的病例数进行对比,来看看哪个模型的预测更准确。

④ 选择那个对于某个特定国家预测结果更好的模型,认为这个模型是最适合用来预测那个国家的COVID-19病例数的。

简单来说,这个研究就是试图找出最好的方法来预测不同国家的COVID-19病例数,帮助我们理解疫情可能如何发展。

GPT看图写作文,我只是搬运过来。也就是用气象数据辅助预测COVID-19,感觉这个思路是万金油,可能也可以预测股票走势。

(2)逐段解析

第一、二段,描述性统计,没啥好说的,就是丰富结果(凑图)呗:

第三段,直奔主题:

翻译一下:

这段时间序列图展示了自疫情开始至2022年1月29日,各个南亚区域合作联盟(SAARC)国家的COVID-19确诊病例趋势。孟加拉国、尼泊尔和巴基斯坦的每日确诊病例在不同时期出现波动,包括一些高速上升的趋势。阿富汗和斯里兰卡的模式非常相似,显示出明显的下降倾向。总体而言,不丹和马尔代夫的COVID-19传播率相对于其他SAARC国家来说较低(见图3)。COVID-19确诊病例与气象变量之间的互相关性在0至30的滞后时间内形成。

为了探究在特定时期气象因素对COVID-19传播的影响,只考虑了正的滞后时间[48]。在阿富汗,最高温度和最低温度在滞后时间0处显示出与COVID-19确诊病例显著相关。在印度,只有在滞后时间4天的最高温度显示出显著关系。在孟加拉国滞后9天和马尔代夫滞后13天的最大风速显示出显著关系。在不丹的滞后26天和尼泊尔的滞后10天的相对湿度与COVID-19确诊病例显示出显著相关。地表气压在印度滞后9天、斯里兰卡滞后13天以及巴基斯坦滞后28天与COVID-19确诊病例显示出显著相关(见图4)。

解读,很明显可以分成两段话:

① 疫情趋势图的描述,没啥好说的哈,就客观描述就好;

② 疫情时序图与气象自变量的相关矩阵分析,我们用SPSS整一下:

第一个图是Afghanistan的疫情与最高温度:

有一点要注意的是定义日期得谁,选天哈。

看看这个结果:相关性绝了,气候因素真实万金油的存在。

回到文章的描述:“在阿富汗,最高温度和最低温度在滞后时间0处显示出与COVID-19确诊病例显著相关。”:问题来了,为啥只描述滞后0处,1-30没有描述?而且最后构建ARIMAX模型的时候,选取哪个滞后阶数?

类似的,其他国家的也是存在这种现象,

“在印度,只有在滞后时间4天的最高温度显示出显著关系。”:然后我发现他们在图四中放错图了,并不是最高温度,正确的图如下:

似乎、貌似、可能0-30天都有相关关系吧,求解答。

其他结果,大家自行探索吧。

第四段,构建ARIMAX模型:

翻译:

上述气象因素作为协变量,在不同的滞后期内被用于ARIMAX模型中,以确定它们对COVID-19确诊病例的影响。例如,在阿富汗,滞后0的最高和最低温度被用作构建ARIMAX模型的协变量。同样,对于孟加拉国、不丹、印度、马尔代夫、尼泊尔、巴基斯坦和斯里兰卡,滞后变量被用作协变量,并在表2中显示了这些变量对疾病的影响。

表2展示了阿富汗同一天(即滞后0)的最低温度(β = -8.93,95% CI: -14.30, -3.56)对COVID-19病例传播产生了负面影响。印度滞后4天的最高温度(β = 0.18,95% CI: 0.01, 0.35)和阿富汗同一天(即滞后0)的最高温度(β = 11.91,95% CI: 4.77, 19.05)对COVID-19确诊病例的传播产生了正面影响。孟加拉国滞后9天的最大风速(β = -53.89,95% CI: -93.45, -14.32)和马尔代夫滞后13天的最大风速(β = -4.24,95% CI: -8.31, -0.18)对COVID-19确诊病例的传播产生了负面影响。尼泊尔滞后10天的相对湿度(β = -4.84,95% CI: -9.20, -0.48)和不丹滞后26天的相对湿度(β = -0.12,95% CI: -0.22, -0.02)对COVID-19确诊病例产生了负面影响。巴基斯坦滞后28天的地面压力(β = 25.77,95% CI: 7.85, 43.69)和斯里兰卡滞后13天的地面压力(β = 411.63,95% CI: 49.04, 774.23)对COVID-19确诊病例产生了正面影响。此外,印度滞后9天的地面压力(β = -1.91,95% CI: -3.75, -0.06)对COVID-19确诊病例的传播产生了负面影响。关于气象因素对COVID-19传播影响的详细结果在表2中呈现。

这里他们把建模策略说的比较详细了:首先建立ARIMA模型,然后纳入气象因素。至于气象因素的滞后因子的取值,就一个一个尝试(统计检验需P值小于0.05),我们使用SPSS,以印度为例子:

(1)寻找最优的ARIMA模型,我就直接上结果:

ARIMA(0,1,6),跟文章中的不太一样,毕竟软件不同。注意,这里没有使用季节参数P、D、Q。

(2)加入最高温度纳入自变量,寻找最优的ARIMAX模型,我把最高温度滞后值从0尝试到30,只有滞后等于19的时候,P值小于0.05:

可以看到,模型的参数除了MAPE提升了不少,其他似乎大同小异。至于“(β = 0.18,95% CI: 0.01, 0.35)”,SPSS似乎不能提供了。

三、个人感悟

ARIMAX模型,并非看着的那么光鲜亮丽,有时候还不如单纯的ARIMA模型。

四、数据

链接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0273319

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2980970.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Android视角看鸿蒙第十二课-鸿蒙的布局之相对布局RelativeContainer

Android视角看鸿蒙第十二课-鸿蒙的布局之相对布局RelativeContainer 导读 相对布局和线性、层叠布局一样都是类似于Android布局的,之前两篇文章已经了解线性、层叠布局的使用方法,这篇文章一起来学习下鸿蒙中的相对布局。 之前的文章中,我偶…

【驱动】AM437x中出现很多bioset进程,杀不掉,有影响吗?

1、问题描述 查看linux系统进程时,发现很多bioset进程 2、问题分析 1)bioset进程是内核线程 这些bioset进程与Linux内核的块I/O(Block Input/Output)层有关,它们是内核线程,不是用户空间的进程。 Linux的块I/O层负责管理磁盘和其他块设备的数据传输。当系统读写磁盘…

【python程序打包教程】PyInstaller一键打包Python程序为独立可执行exe文件

《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ 👍感谢小伙伴们点赞、关注! 《------往期经典推…

AI大模型探索之路-认知篇4:大语言模型预训练基础认知

文章目录 前言一、预训练流程分析二、预训练两大挑战三、预训练网络通信四、预训练数据并行五、预训练模型并行六、预训练3D并行七、预训练代码示例总结 前言 在人工智能的宏伟蓝图中,大语言模型(LLM)的预训练是构筑智慧之塔的基石。预训练过…

嵌入式s5p5818核心板介绍

底板寻址空间介绍 s5p6818 寻址空间采用统一编址方式进行管理 寻址空间映射图: 独立寻址:片内片外存储器只能选择其中一个 统一寻址:片内片外存储器都能使用,且使用的是同一片连续的寻址空间 reserved保留,Normaol …

Ubuntu20.04安装redis5.0.7

redis下载命令: wget https://download.redis.io/releases/redis-5.0.7.tar.gz 解压到 opt目录下 tar -zxvf redis-5.0.7.tar.gz -C /opt apt install -y gcc # 安装gccapt install make # 安装make 后面执行make一直报错 make报错后清除: make …

【03-掌握Scikit-learn:深入机器学习的实用技术】

文章目录 前言数据预处理缺失值处理数据缩放特征选择模型训练参数调整模型评估总结前言 经过了对Python和Scikit-learn的基础安装及简单应用,我们现在将更深入地探究Scikit-learn的实用技术,以进一步提升我们的数据科学技能。在本文中,我们将涵盖数据预处理、特征选择、模型…

WebSocket的原理、作用、常见注解和生命周期的简单介绍,附带SpringBoot示例

文章目录 WebSocket是什么WebSocket的原理WebSocket的作用全双工和半双工客户端【浏览器】API服务端 【Java】APIWebSocket的生命周期WebSocket的常见注解SpringBoot简单代码示例 WebSocket是什么 WebSocket是一种 通信协议 ,它在 客户端和服务器之间建立了一个双向…

Vue3中使用无缝滚动插件vue3-seamless-scroll

官网:https://www.npmjs.com/package/vue-seamless-scroll 1、实现效果文字描述: 表格中的列数据进行横向无缝滚动,某一列进行筛选的时候,重新请求后端的数据,进行刷新 2、安装:npm i vue3-seamless-scrol…

Git和Github绑定

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

基于RT-Thread的智能家居助手

一、项目简介 智能家居助手主要基于RT-Thread开发的,该系统主要分为语音子系统,环境监测子系统,智能控制子系统,智能网关子系统,音乐播放器,云端以及应用软件七大部分。语音子系统可通过语音进行人机交互来…

SMT工艺上出现焊锡球,将有什么影响?

在表面贴装技术(SMT)加工过程中,可能会出现焊锡球形成的问题,焊锡球的存在不仅影响产品的外观质量,还可能导致电路短路,从而影响产品性能和可靠性,所以必须提前了解焊锡球的形成原因&#xff0c…

Tensorflow2.0笔记 - BatchNormalization

本笔记记录BN层相关的代码。关于BatchNormalization,可以自行百度,或参考这里: 一文读懂Batch Normalization - 知乎神经网络基础系列: 《深度学习中常见激活函数的原理和特点》《过拟合: dropout原理和在模型中的多种应用》深度…

(五)AB测试及两个案例 学习简要笔记 #统计学 #CDA学习打卡

目录 一. AB测试简介 1)假设检验的一般步骤 2)基于假设检验的AB测试步骤 二. 案例1:使用基于均值的假设检验进行AB测试 1)原始数据 2)提出原假设H0和备择假设H1 3)使用均值之差的t检验,计…

Electron+Vue3+ElectronForge整合 - 打包时整合 -分步打包

说明 本文介绍一下 Electron Vue3 的打包整合的基本操作。实现的效果是 : 1、一个正常的Vue3项目; 2、整合加入 Electron 框架 :开发时 Electron 加载的是开发的vue项目; 3、完成打包时整合:3.1 先完成vue3项目的正常…

vue3 引入@tsparticles/vue3和@tsparticles/slim 实现粒子特效

1.安装: yarn add tsparticles/vue3 tsparticles/slim2.main.ts 引入 import Particles from "tsparticles/vue3"; import { loadSlim } from "tsparticles/slim";app.use(Particles as any, {init: async (engine: any) > {await loadSli…

如何在 Flutter 中制作多种颜色的 TextField

TextField widget 本身并不施加任何样式。相反,它会要求 TextEditingController 生成一个样式化的 TextSpan 对象,即一段带有样式的文本。 TextField 将其样式传递给 TextEditingController ,默认实现只是将其放入 TextSpan 对象中&#xff0…

光纤网络电力控制系统设计方案:623-6U CPCI的光纤网络电力控制系统

6U CPCI的光纤网络电力控制系统 一、设备概述 柔性直流输电系统中用于控制与测量的FS系统,适用于风电和太阳能发电的并网快速数值计算和闭环控制,以及与直流输电系统的换流器有关的特殊控制功能,包括门控单元的信号处理。该控制板的最大…

【C语言回顾】操作符详解

前言1. 操作符分类2. 二进制和进制转换2.1 二进制2.2 进制转换2.2.1 二进制转十进制2.2.2 二进制转八进制2.2.3 二进制转十六进制 3. 原码、反码、补码4. 移位操作符4.1 左移操作符4.2 右移操作符 5. 位操作符6. 单目操作符7. 逗号表达式8. 下标引用操作符9. 函数调用操作符10.…

3D 文件格式的江湖纷争

自从上世纪 60 年代计算机辅助设计(Computer Aided Design, CAD)发明已来,3D 图形产业繁荣发展,逐步覆盖工业制造、影视游戏、VR/AR 、3D 打印等各个领域。如果说 3D 模型是构成 XR 应用场景的基础组件,那么 3D 文件格式就是构建 XR 世界沟通语言。而伴随各种 3D 建模软件…