新冠數據整理和簡單分析(四)——基於SEAIR模型逆推潛伏期時長分佈

簡單介紹

最近花了一些時間完成了一個關於新冠肺炎潛伏期的研究,主要是基於在我之前寫的新冠數據整理和簡單分析(三)中提到的SEAIR模型,我利用SEAIR中潛伏期向發病期(有症狀和無症狀兩種)轉化的動態過程來完成對新冠病毒潛伏期的時間概率分佈的推導。這也是我對於新冠系列分析的尾聲,算是對我之前寫到的三部分內容的提升和總結。

因爲該方法基於數學模型,所以難免涉及一些理想假設,但是我所使用的所有假設都是嚴格根據現有研究的結論作爲參考和依據,因此還算是較合理的。當然,這個方法也有着非常明顯的優點,主要可以歸結爲兩個方面。首先,這個方法所使用的數據是官方統計報道的全國每日確證病例,而非是使用傳統的抽樣調查法,這從一定程度上避免了樣本偏差,回憶偏差和範圍偏差,並且還降低了研究成本。其次,這個方法不需要對潛伏期分佈有任何的形狀假設(服從某種分佈),因此從某種程度得到的結果會更趨近於真實情況。

接下來我簡單描述這種方法的思想。

具有離散潛伏期的SEAIR模型

SEAIR模型概念圖
上圖所示是定義的一個具有離散潛伏期特質的SEAIR模型。我們只關注從 EE(被感染人羣)向 II(發病有症狀人羣)和 AA(發病無症狀人羣)轉變的這一動態過程。感染者 EE 的發病時長符合一個離散的概率分佈。

推斷過程

在這個模型中 ItI_tAtA_t 是從哪裏產生的呢?一個合理的解釋就是 ItI_tAtA_t 應該來自於過去不小心被感染的那些 EE 人羣,也就是說 ItI_tAtA_t 是由 E(0,t1)E_{(0, t-1)} 產生的。如果存在一個統一的潛伏期時長概率分佈的話,那麼我們就可以列出這樣的關係式:ΔAt+ΔIt=ΔEtk×pk+ΔEtk+1×pk1ΔEt1×p1+ϵt\Delta A_{t}+\Delta I_{t}=\Delta E_{t-k}\times p_{k}+\Delta E_{t-k+1}\times p_{k-1}\cdots \Delta E_{t-1}\times p_{1}+\epsilon_{t} 在該式子中的 pkp_k 代表一個感染者在感染後第 kk 天發病的概率(也就是說擁有一個 kk 天的潛伏期)。對於整個時間序列,我們就可以構建多元線性迴歸來求解該問題。

結果展示

通過使用Basin-hopping算法求解該問題的近似全局最優,我們可以獲得對 P=(p1,p2,...,pk)P=(p_1,p_2,...,p_k) 的估計值。並且可以使用樣條曲線將這些離散點連接。
在這裏插入圖片描述
上面是將該方法用到不同的國家的數據之後預測出來的潛伏期分佈圖像,右側的圖是95%的置信區間。整體結果還是很穩定的,而且與現有的研究結果也相符合。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章