基于SEAIR模型逆推潜伏期时长分布
简单介绍
最近花了一些时间完成了一个关于新冠肺炎潜伏期的研究,主要是基于在我之前写的新冠数据整理和简单分析(三)中提到的SEAIR模型,我利用SEAIR中潜伏期向发病期(有症状和无症状两种)转化的动态过程来完成对新冠病毒潜伏期的时间概率分布的推导。这也是我对于新冠系列分析的尾声,算是对我之前写到的三部分内容的提升和总结。
因为该方法基于数学模型,所以难免涉及一些理想假设,但是我所使用的所有假设都是严格根据现有研究的结论作为参考和依据,因此还算是较合理的。当然,这个方法也有着非常明显的优点,主要可以归结为两个方面。首先,这个方法所使用的数据是官方统计报道的全国每日确证病例,而非是使用传统的抽样调查法,这从一定程度上避免了样本偏差,回忆偏差和范围偏差,并且还降低了研究成本。其次,这个方法不需要对潜伏期分布有任何的形状假设(服从某种分布),因此从某种程度得到的结果会更趋近于真实情况。
接下来我简单描述这种方法的思想。
具有离散潜伏期的SEAIR模型
上图所示是定义的一个具有离散潜伏期特质的SEAIR模型。我们只关注从 (被感染人群)向 (发病有症状人群)和 (发病无症状人群)转变的这一动态过程。感染者 的发病时长符合一个离散的概率分布。
推断过程
在这个模型中 和 是从哪里产生的呢?一个合理的解释就是 和 应该来自于过去不小心被感染的那些 人群,也就是说 和 是由 产生的。如果存在一个统一的潜伏期时长概率分布的话,那么我们就可以列出这样的关系式: 在该式子中的 代表一个感染者在感染后第 天发病的概率(也就是说拥有一个 天的潜伏期)。对于整个时间序列,我们就可以构建多元线性回归来求解该问题。
结果展示
通过使用Basin-hopping算法求解该问题的近似全局最优,我们可以获得对 的估计值。并且可以使用样条曲线将这些离散点连接。
上面是将该方法用到不同的国家的数据之后预测出来的潜伏期分布图像,右侧的图是95%的置信区间。整体结果还是很稳定的,而且与现有的研究结果也相符合。