Closed ixxmu closed 3 years ago
说在最前面
文章首发于微信公众号:
因为内容都是原创的,所以禁止各种商用,禁止转载,转载请公众号留言联系小编,且注明来源!如有发现必追究。
自2019年新冠疫情发生以来,我国政府和人民全力以赴抗击疫情,全国动员、全面部署、快速反应,采取了最全面、最严格的防控举措,打响了一场疫情防控的人民战争,同时新冠疫情在学术届也引起了强烈关注,对于新冠的研究也成为今年的生物、医学、地理学等学科的热点。比如这样:
也可以是这样的:
(以上图片来源于网络,侵删)
一直以来,课题研究最难的就是数据的获取与处理,想要进行新冠数据研究的小伙伴可以看过来啦。
小编找到一个神器,当!当!当!
covidregionaldata包
2021年7月5号公布的这个包—covidregionaldata,用来获取地方和国家层面的COVID-19数据,这个数据来自官方来源,如公共卫生在英国,英格兰和其他COVID-19数据收集,包括世界卫生组织(世卫组织),欧洲疾病预防和控制中心(ECDC),约翰·霍普金斯大学(JHU),谷歌公开数据等等。旨在以公开和透明的方式简化来自各种数据源的COVID-19数据提取、清理和处理。可以说大大缩短了数据清洗的时间,神器有没有。
小编接下来会详细演示这个包来获取COVID-19数据的过程。为了方面查阅备用,可收藏呦!创作不易,喜欢的小伙伴点个赞哈或者关注一下~
以WHO为例的COVID-19数据下载过程
在这个包中提供的数据源除了WHO之外,其实还包括Belgium, Brazil, Canada, Colombia, Covid19DataHub, Cuba, France, Germany, Google, India, Italy, JHU, Lithuania, Mexico, Netherlands, SouthAfrica, Switzerland, UK。下载方式都很类似,这里以WHO为例来探索下载数据的过程。
在new这个方法中,各参数的作用如下:
level='1'用来设置城市数据,level='2'用来设置regions数据,level默认为'1',level='3'用来设置子regions数据
verbose默认为TRUE。是否应该返回详细的处理消息和警告;step=TRUE用来保存每个处理步骤的数据;get用来获取数据
library(covidregionaldata)
start_using_memoise()
national <- WHO$new(verbose = TRUE, steps = TRUE, get = TRUE)
下图是数据下载的过程,可以看到数据的下载源:
Downloading data from covid19.who.int/WHO-COV
和一些数据的基本变量的情况,比如数据的类型,数据的行数和列数
national$return()
(1)用return来返回所有数据的结果,且用了DT方式来展现了表格结果,真的是蛮漂亮的。针对WHOreturn的结果,共返回5个表格,基本数据都是一致的,就是各表格会在一些字段上有区别。
显示数据包括的城市或者地区信息,这里打印的是城市列表。
national$available_regions()
并不是所有的数据来源都有地区数据的,WHO就没有level='2'的设置,Covid19DataHub$new(level = "2") 这个就可以
(2) 有设置下载的功能,直接这个即可
national$download()
(3) 有设置筛选功能,只需要filter即可;也可以在最开始的new部分,设置参数region='Albania'
national$filter("Albania")
national$process()
national$return()
一个小提示
往期R数据分析文章:
R内置生物方向数据集又来了新伙伴—Biostatistics
点击蓝字 关注我们 SUBSCRIBE to US
END
有关于其他R语言的问题可以直接私信小编哈。
请大家多多支持,后面会推出更多的知识分享或者课程,感兴趣的点击关注哈。
Children's Day
算法学习日程本
小编微信号|fengxiao292
知乎|R语言数据派
https://mp.weixin.qq.com/s/cCcxerV3WwIwehGEErE0Ag