Open CutieDeng opened 2 years ago
将所有的信息分成两部分,一部分描述为「原始信息」,另一部分描述为「附加信息」。条件:原始信息能够自动地推导出附加信息,即——在接下来具体的实现中,不会实际存储附加信息,以节约存储的磁盘空间和避免信息不一致错误。
smoothed关键词仍待解决,目前的理解是“降噪”
无法正常显示可以点击Data atom model v1125.pdf进行阅读。
This modification is modified at 22:44, Nov. 25, 2021.
[raw information] Some ISO code starting with 'OWID' such as 'OWID_NAM' is the summary of the information of a continent. It stored the position information in col 'location' rather than 'continent'.
\<Country>
\<Time>
Total cases
You can using difference equation to imply to 'new cases' values.
Total deaths
:grey_question:Total cases per million(total deaths, new deaths,
:grey_exclamation:Reproduction rate
Patients in ICU
Patients in hospitals
Weekly ICU admissions
Weekly hospital admissions
Total tests
:grey_exclamation:Positive rate
:grey_exclamation:Tests per case
:grey_exclamation:Tests units
Total vaccinations
People vaccinated
People fully vaccinated
:question:Total boosters
Stringency index
Excess mortality cumulative absolute
Excess mortality cumulative
Excess mortality
Excess mortality cumulative per million
已经仔细阅读了你目前上传的整理数据的代码。现提出两点问题:
收到你的询问,现给出回答:
Scanner
本身带有相对友好的预处理功能,效率偏低;在需要效率的情况下,建议改成 BufferedReader
. 顺便补充接下来对数据处理的工作:
对数据表格标题翻译的修正意见
所有英文单词后面请使用 "," (等英文标点)
total_cases
等标题的单位为「人」。total_cases
与new_cases
提供的信息内容是可互相推导的,忽略new_cases
相关列。stringency_index
: 财政紧缩指数handwashing_facilities
: 卫生设施reproduction rate: 基本传染数,基本再生数。 是指没有任何防疫作为介入且所有人没有免疫力情况下,一个感染到某种传染病的初发个案,能够把疾病传染给其他多少个人的平均数。 基本传染数通常写作 $R_0$ . 容易发现,该值愈大,即流行病愈难控制。 在没有防疫情况下:
见:维基百科:基本传染数
补充:
icu_patients
: 进入 ICU 的病例数hosp_patients
: 入院病例数weekly_icu_admissions
: 周进入 ICU 病例数new_tests
: 检测数positive_rate
: (检测)阳性率tests_units
: 检测单元total_vaccinations
: 接种疫苗数total_boosters_per_hundred
: (疫苗)加强针接种数excess_mortality_cumulative
: 超额死亡累计数