
新冠肺炎时序数据预测算法设计
摘要:
新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,本文采用新
冠肺炎的时序历史数据,尝试利用 Logistic 回归模型、SEITR 动力学模型、LSTM 神经网络等
数学模型预测疫情发展趋势与关键节点,对疫情的规模进行定量分析,对疫情原始基数和有
效传播率进行科学和可靠的区间估算并进行不同算法的对比分析,为疫情防控中的分析、指
挥和决策提供有效依据和指南。
算法说明
这里采用了三种算法对于疫情时序数据进行拟合:Logistic 回归模型、SEITR 动力学模
型、LSTM 神经网络。
Logistic 回归模型
Logistic 函数或 Logistic 曲线是一种常见的 S 形函数,它是皮埃尔·弗朗索瓦·韦吕勒在 1844
或 1845 年在研究它与人口增长的关系时命名的。该模型广泛应用于生物繁殖和生长过程、
人口增长过程模拟,因此也可以在一定程度上对病毒传播和确诊人数增长过程进行拟合。该
函数常用的公式如下:
(1)
其中,a、b、K 为皮尔模型的参数,估算这三个参数的方法有两类:一类是先估算出 a
和 K,然后推算 b 值,如 Fisher 法;另一类是同时估算出参数 a、b、K,如倒数总和法。结
合疫情发生的实际场景,y 为累计病例人数(例/天);t 为时间(天);K、a、b 为模型参数。
从模型可知 K 为疫情规模,即累计病例最大值;a、b 为控制传染速度的参数。