简体中文 | English
估计和预测 2019-nCoV 新型冠状病毒在武汉的爆发情况
MSE, basic SEIR model, sentiment analysis 了解 SEIR 模型原理
- 模型 1: 估计武汉封城时的感染人数
- 模型 2: 模拟预测武汉封城后肺炎感染人数以及峰值
根据丁香园实时数据预测全国未来两个月的肺炎趋势
Author: Shih Heng Lo(模型灵感的提供以及指导者); Yiran Jing.
Baseline: Ridge regression, improved by Dynamic SEIR model
模型的各种假设对结论的影响非常大。(很难收集到足够准确且全面的信息,所以有些假设未必合适)
以下的模型都非常简单,而且没有包含足够多的数据,所得结论只是粗略估计
2020年1月23日,交通枢纽的武汉市被封城。900万人民被困在武汉市区。在此之前,有500万人因春节离开武汉。估计机场的国际人流量为1900万。
考虑到新型武汉肺炎的快速传播性和武汉居住人口在封城前后变化巨大,我选择了不同的模型来估计封城前后武汉的感染人数,主要参考和借鉴今日发表的相关论文,数据参考官方数据。
主要结论(仅仅针对武汉市): 截止1月23日,武汉有超过 38500 名感染者加确诊者,95%置信区间(30000, 48470),根据1月29号海外发现的感染人数计算,引用2018年的交通数据估算。
Method: Considering Wuhan is the major air and train transportation hub of China, we use the number of cases exported from Wuhan internationally as the sample, assuming the infected people follow a Possion distribution, then calculate the 95% confidence interval by profile likelihood method. Sensitivity analysis followed by.
Reference: report2 (Jan 21)
作者: 景怡然
Method: Deterministic SEIR (susceptible-exposed-infectious- recovered) model and Sensitivity analysis
主要结论(仅仅针对武汉市): (根据 2019-12-08 至 2020-02-02 的官方数据)
根据2月2号官方媒体爆料,患者发现并不及时而且隔离措施也没有做的很好。基于这个现实,武汉肺炎患者的实际峰值很可能超过10万甚至15万。 更新:2月5号之后,武汉新建的三所医院开始收纳病患(共计有6000床位),所以现在的传染风险应该有明显下降,毕竟更多的病人可以被医院收容(治疗/强制隔离)
作者: 羅士恆; 景怡然
Method: Dynamic SEIR (susceptible-exposed-infectious- recovered) model, Gradient Descent Model comparison based on the test score (MAPE) of last 5 days, baseline is ridge Ridge regression Reference: Dynamic SIR model
主要结论(针对全国): (根据 2019-12-08 至 2020-02-13 官方数据)
模型主要假设:了解 SEIR 模型原理
红色的线为现存感染人数的走势预测 注释:
The mean absolute percentage error (MAPE) is a measure of prediction accuracy of a forecasting method in statistics. The MAPE of confirmed cases using data between 2020- 2-14 to 2020-02-22 is 0.0066. The figure below visualizes the real observation and the SEIR model predictions for the next 9 days. Overall, SEIR model predicts well for the peaking time and the general trend.
Optimization algorithm Gradient Descent
## Update data from DXY
$ cd ../data_processing && python DXY_AreaData_query.py # save data out to data folder.
CoronaTracker Analytics Dashboard
目前关于肺炎的学习和任务,以及接下来的方向在这里更新:Project
如果你对肺炎相关的数据分析和可视化感兴趣,请联系我!