分享

数据分享|PYTHON可视化探索新冠疫情病毒与失业率是否存在线性关系

 拓端数据 2022-09-13 发布于上海

全文链接:http:///?p=28560

作者:Chang Gao

2020年疫情愈演愈烈,新冠的检测与确诊人数也急剧上飙,失控的疫情无疑给经济造成了巨大的打击,同时也极大的影响了就业市场。对于政府来说,分析确定线性关系是对未来走向进行评估预测的重要基石,但是使用python进行提取数据进行整合并且使用可视化清晰的呈现线性关系并不是一件容易的事情

相关视频

解决方案

任务/目标

基于政府提供的线上数据,运用数据源分析探究新冠病毒检测人数与失业率是否存在线性关系。

数据源准备

第一个数据源来自失业率统计。

第二个数据源来自新冠检测及病例数统计数据。

数据源导入

使用API将数据导入Python提取可用部分,并将数据源用data frame的形式呈现,同时使用.describe()对其进行了简单的整理描述。自此对数据的类型及基本情况(两个数据集的平均数,中位数,方差,最大最小值)有了一个基本的了解。

ERD图解

图片

数据初步可视化

图片

图片


点击标题查阅往期内容

图片

Python用RNN神经网络:LSTM、GRU、回归和ARIMA对COVID19新冠疫情人数时间序列预测

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

数据清洗

检查新冠病毒数据集的异常值并对其进行清洗,将清洗后的数据集重新计算平均值并将两个数据集进行合并。

图片

项目结果

在此案例中,我利用折线图将失业率进行可视化处理,同时利用散点图对新冠病毒案例及检测数进行可视化处理并将检测结果为阳性的案例进行进一步提取(同时借助tableau对新冠病毒进行更加清晰的可视化处理),其可视化图形如下:

图片

图片

图片

图片

可以看出,新冠病毒的病例及检测数与失业率并没有明显的线性关系,但在疫情爆发的初期,新冠病毒的爆发的确对经济及就业市场造成了巨大的影响。

由于并不存在明显可靠的线性关系,我们无法对未来失业率或是新冠病毒的案例及检测数进行准确的预估。我们需要更多的相关数据进行分析评估及预测。

关于作者

在此对Chang Gao对本文所作的贡献表示诚挚感谢,她专长商业数据分析、数据可视化、数据采集。


图片

本文选自《PYTHON可视化探索新冠疫情病毒与失业率是否存在线性关系》。


图片

用航空公司复杂网络对疫情进行建模
R语言社区发现算法检测心理学复杂网络:spinglass、探索性图分析walktrap算法与可视化
R语言复杂网络分析:聚类(社区检测)和可视化
使用Python和SAS Viya分析社交网络
R语言用igraph绘制网络图可视化
在R语言中使用航空公司复杂网络对疫情进行建模
R语言用相关网络图可视化分析汽车配置和饮酒习惯
R语言公交地铁路线进出站数据挖掘网络图可视化
python对网络图networkx进行社区检测和彩色绘图
R语言推特twitter网络转发可视化分析
R语言复杂网络分析:聚类(社区检测)和可视化
R语言混合图形模型MGM的网络可预测性分析
R语言使用自组织映射神经网络(SOM)进行客户细分
R语言网络分析友谊悖论案例
R语言网络和网络流的可视化实践:通勤者流动网络
R语言最大流最小割定理和最短路径算法分析交通网络流量拥堵问题
R语言公交地铁路线网络图实现数据挖掘实战
R软件SIR模型网络结构扩散过程模拟
通过SAS网络分析对人口迁移进行可视化分析
python隶属关系图模型:基于模型的网络中密集重叠社区检测方法
使用Python和SAS Viya分析社交网络
用R语言和python进行社交网络中的社区检测
python图工具中基于随机块模型动态网络社团检测
在R语言中使用航空公司复杂网络对疫情进行建模
采用SPSS Modeler的Web复杂网络对所有腧穴进行分析

图片

图片

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多