1.思路
基于每日發(fā)布的COVID-19確診感染人數(shù),采用SEIR(Susceptible-Exposed-Infected-Recovered)傳染病動(dòng)力學(xué)模型,利用最小二乘法
對模型中的參數(shù)
β
,
k
,
γ
,
μ
\beta,k,\gamma,\mu
β,k,γ,μ 以及潛伏者的初值E(0)進(jìn)行擬合估計(jì),選擇合適的數(shù)據(jù)集和參數(shù)范圍,進(jìn)一步提高模型預(yù)測的精度和準(zhǔn)度。該方法能夠合理地預(yù)測美國COVID-19疫情確診感染人數(shù)、死亡人數(shù)和疫情穩(wěn)定階段,對美國確診感染人數(shù)的預(yù)測平均誤差率在6%左右,對于疫情防控具有實(shí)用價(jià)值,對美國COVID-19疫情傳播趨勢具有研究意義。
為預(yù)測美國COVID-19疫情傳播情況,本文主要分為4個(gè)部分。
第一部分:建立SEIR模型
,在原始模型基礎(chǔ)上進(jìn)行改進(jìn),以提高精度和準(zhǔn)度。
第二部分:模型求解,獲取數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理
,運(yùn)用最小二乘擬合
進(jìn)行參數(shù)估計(jì)
,進(jìn)而預(yù)測分析確診感染人數(shù)。
第三部分:模型分析,對模型的可行性
和靈敏度
進(jìn)行分析,確定模型的精度和準(zhǔn)度。
2.問題分析
2.1問題重述
以一個(gè)國家或一個(gè)省/市的數(shù)據(jù)為例,建立數(shù)學(xué)模型描述新冠病毒的傳播規(guī)律,并進(jìn)行預(yù)測和分析,可以美國、香港或上海為例。本文選取美國作為研究對象,進(jìn)行參數(shù)擬合和結(jié)果預(yù)測。主要的問題如下:
-
問題1:獲取美國自COVID-19疫情發(fā)展之初至今的每日總確診數(shù)以及單日新增 感染、治愈、死亡人數(shù),并整合到excel數(shù)據(jù)表格中;
-
問題2:基于已知數(shù)據(jù),建立COVID-19疫情預(yù)測模型,對模型中的參數(shù)進(jìn)行擬合,獲取最優(yōu)擬合參數(shù),預(yù)測美國COVID-19疫情傳播趨勢以及確診人數(shù);
-
問題3:對模型進(jìn)行可行性分析、靈敏度分析以及誤差分析,判斷預(yù)測結(jié)果的準(zhǔn)確性和精度;
-
問題4:將模型運(yùn)用于實(shí)際問題中,分析不同疫情防控措施對美國COVID-19疫情傳播的影響,獲取最佳的防控措施。
2.2研究過程
選取SEIR模型進(jìn)行數(shù)學(xué)建模。
? 圖1-研究過程
3.合理假設(shè)
(1) 不考慮出生和死亡,假設(shè)總?cè)丝跒橐粋€(gè)常數(shù);
(2) 治愈后的個(gè)體具有免疫能力,不會(huì)再次感染;
(3) 人群分為易感人群、潛伏人群、感染人群和康復(fù)人群;
(4) 康復(fù)人群中包含治愈和死亡人數(shù);
(5) 不考慮疫苗的預(yù)防作用。
4.符號(hào)定義
? 表1-符號(hào)定義
符號(hào) | 定義 |
---|---|
β \beta β | 感染系數(shù) |
k k k | 從暴露人群到確診感染者的概率 |
γ \gamma γ | 恢復(fù)系數(shù) |
μ \mu μ | 死亡率 |
5.模型求解
5.1獲取數(shù)據(jù)
在worldometer網(wǎng)站上有全球范圍內(nèi)較為權(quán)威的COVID-19感染人數(shù)統(tǒng)計(jì)情況,通過python程序獲取網(wǎng)站的html文件并通過正則匹配獲取美國疫情感染人數(shù),部分?jǐn)?shù)據(jù)如表2所示。由于人數(shù)較多,在不同時(shí)間統(tǒng)計(jì)結(jié)果中,近期的確診人數(shù)不同,但數(shù)據(jù)差異不大,可忽略不計(jì)。
? 表2-COVID-19感染人數(shù)
日期 | 現(xiàn)存確診 | 新增確診 | 總確診 |
---|---|---|---|
2020-02-20 | 10 | 0 | 15 |
2020-02-21 | 29 | 20 | 35 |
2020-02-22 | 29 | 0 | 35 |
2020-02-23 | 28 | 0 | 35 |
2022-04-01 | 15429442 | 33740 | 81823322 |
2022-04-02 | 15311698 | 26663 | 81849985 |
2022-04-03 | 15175351 | 19579 | 81869564 |
2022-04-04 | 15037249 | 24048 | 81893612 |
2022-04-05 | 14938259 | 29696 | 81923308 |
2022-04-06 | 14840712 | 32311 | 81955619 |
2022-04-07 | 14757686 | 32659 | 81988278 |
? 圖2-感染數(shù)據(jù)
5.2參數(shù)估計(jì)
目前已獲取美國自疫情傳播以來的所有數(shù)據(jù),截至2022年4月7日,共有783組數(shù)據(jù),數(shù)據(jù)量較大,可以直接進(jìn)行參數(shù)擬合,不需要進(jìn)行插值處理。
目前需要進(jìn)行擬合的未知參數(shù)包括 β , k , γ , μ \beta,k,\gamma,\mu β,k,γ,μ 以及E(0)。
考慮到過擬合和病毒傳播特性,采用近150天的數(shù)據(jù)進(jìn)行最小二乘擬合,擬合后的參數(shù)值如表3所示。
? 表3-擬合后參數(shù)值
參數(shù) | 擬合值 |
---|---|
β \beta β | 0.014419668870111 |
k k k | 0.012296625823406 |
γ \gamma γ | 0.001492483739052 |
μ \mu μ | 0.008410009646738 |
E(0) | 2.801840825482927e+07 |
5.3感染人數(shù)預(yù)測
通過以上模型和擬合過程,基于5.2中擬合出的參數(shù),預(yù)測出接下來4年時(shí)間美國COVID-19感染人數(shù),得到每日疫情預(yù)測情況。預(yù)測出的部分?jǐn)?shù)據(jù)如表4所示。預(yù)測出的美國COVID-19疫情傳播趨勢如圖Y軸為linear形式如圖3所示,Y軸為log形式如圖4所示。
? 表4-擬合數(shù)據(jù)
日期 | 現(xiàn)存確診/人數(shù) | 新增確診/人數(shù) | 總確診/人數(shù) |
---|---|---|---|
2022-04-08 | 21791043 | 249395 | 87694573 |
2022-04-09 | 21824505 | 249487 | 87944060 |
2022-04-10 | 21857732 | 249582 | 88193642 |
2022-04-11 | 21890731 | 249679 | 88443321 |
2022-04-12 | 21923505 | 249777 | 88693098 |
2022-04-13 | 21956061 | 249879 | 88942977 |
2022-04-14 | 21988405 | 249982 | 89192959 |
2022-04-15 | 22020542 | 250087 | 89443046 |
2022-04-16 | 22052477 | 250195 | 89693241 |
2022-04-17 | 22084217 | 250304 | 89943545 |
? 圖3-Y軸為linear
? 圖4-Y軸為log
6.模型檢驗(yàn)與分析
6.1可行性分析
(1) 模型假設(shè)總?cè)丝跒槌?shù)是可行的。在短時(shí)間內(nèi),出生人口數(shù)和死亡人口數(shù)可忽略不計(jì)。使用2020年至今的數(shù)據(jù)預(yù)測接下來兩年時(shí)間美國感染人數(shù),總計(jì)4年時(shí)間,時(shí)間較短,人口數(shù)量起伏不大,可以忽略不計(jì)。
(2) 模型假設(shè)治愈后的人群具有免疫能力,康復(fù)后不會(huì)被感染是可行的。世界衛(wèi)生組織曾公布康復(fù)者仍有可能二次感染,但這里的二次感染大多數(shù)是因?yàn)楹怂釞z測和抗體檢測的假陽性問題,對于完全康復(fù)的人群,其二次感染的可能幾乎為0,所以可以假設(shè)康復(fù)人群具有免疫能力。
(3) 假設(shè)總?cè)巳悍譃橐赘腥巳骸摲巳?、感染人群和康?fù)人群是可行的。美國沒有實(shí)行嚴(yán)格的防疫措施,幾乎沒有任何隔離措施,另外美國人更注重自由,所以可以假設(shè)所有人都暴露在病毒之下。
6.2靈敏度分析
采用不同的參數(shù)結(jié)果不同,采用不同參數(shù)總確診數(shù)增幅不同,如圖5所示。從圖中可以看出,beta越大,k越大,gamma越小,mu越小,則總確診人數(shù)的增幅越大,總確診人數(shù)越大。由圖6可知,當(dāng)beta和k增大到一定范圍內(nèi),對確診人數(shù)的影響較小,不同參數(shù)時(shí)總確診人數(shù)相同。
? 圖5-參數(shù)變化對美國COVID-19疫情傳播的影響
? 圖6- $ \beta $ 和 k k k 較大時(shí)對美國COVID-19疫情傳播的影響
6.3模型精度
根據(jù)真實(shí)總感染人數(shù)和預(yù)測總感染人數(shù)計(jì)算誤差,獲取相對誤差,2022年03月01至2022年03月10日的真實(shí)感染人數(shù)和預(yù)測感染人數(shù)如表5所示。
? 表5- 美國確診人數(shù)預(yù)測結(jié)果表
日期 | 預(yù)測確診 人數(shù) | 實(shí)際確診 人數(shù) | 相對誤差 |
---|---|---|---|
2022-03-01 | 78264620 | 80807299 | 3.14% |
2022-03-02 | 78511957 | 80859204 | 2.90% |
2022-03-03 | 78759317 | 80913172 | 2.66% |
2022-03-04 | 79006701 | 80961171 | 2.41% |
2022-03-05 | 79254112 | 80999815 | 2.16% |
2022-03-06 | 79501550 | 81024985 | 1.88% |
2022-03-07 | 79749019 | 81053566 | 1.61% |
2022-03-08 | 79996518 | 81088326 | 1.35% |
2022-03-09 | 80244050 | 81129499 | 1.09% |
2022-03-10 | 80491618 | 81173942 | 0.84% |
從表5中可以看出,預(yù)測的部分?jǐn)?shù)據(jù)誤差在0.8%到3.2%之間,誤差較小。
在進(jìn)行擬合的150組數(shù)據(jù)中,誤差范圍在0-14.9%之間,平均相對誤差為6.42%,擬合效果較好,且有充分的數(shù)據(jù)支撐,可以較好的模擬出美國COVID-19疫情傳播趨勢。
6.4誤差分析和模型改進(jìn)
在該模型中,預(yù)測的結(jié)果仍有平均6.42%的誤差,可能是以下幾個(gè)原因造成的:
(1) 考慮到病毒的不確定性,美國COVID-19新增確診人數(shù)波動(dòng)性較大,較難獲取最佳擬合效果。
(2) 隨著疫情的發(fā)展以及科學(xué)技術(shù)水平的不斷提高,新冠疫苗問世,但是本模型沒有考慮疫苗的作用,可以增加新的變量代表疫苗的預(yù)防效果。在疫苗的作用下,接種疫苗的人群感染概率較低,并不均為易感人群。
(3) 本模型使用的數(shù)據(jù)為近150天的數(shù)據(jù),奧密克戎毒株在美國盛行,但未來產(chǎn)生的新變異毒株的傳染性未知,可能和奧密克戎毒株差異較大。僅使用SEIR模型具有局限性,可考慮結(jié)合其他模型及擬合方法,例如 AI模型,獲取更好的擬合效果和預(yù)測精度。
(4) 沒有考慮隱形傳播者,即尚未被確診但實(shí)際上已經(jīng)感染新冠病毒的混在健康者中的人群,這類人群有更高的感染系數(shù),所以需要對潛伏者和感染者進(jìn)行重新定義,包含隱形傳播者。
(5) 忽略了潛伏期患者的傳播風(fēng)險(xiǎn),潛伏人群仍具有一定的傳播風(fēng)險(xiǎn),但在本模型中將其假設(shè)為無傳染性。
(6) 沒有考慮住院或隔離患者的傳染性,隔離和住院感染者可接觸到的人群較少,且有較好的防護(hù)措施,和普通感染者的感染系數(shù)不同。
7. 結(jié)論
在不進(jìn)行附加干預(yù)措施的情況下,在2026年左右美國疫情傳播將到達(dá)穩(wěn)定階段,所有COVID-19感染者將會(huì)被治愈或死亡,現(xiàn)存確診較少,僅有 1000例左右,S,E,I,R均趨于穩(wěn)定,但是此時(shí)感染者人數(shù)已超過美國總?cè)丝诘?/3,死亡人數(shù)已超過200萬人。所以,進(jìn)行有效的預(yù)防措施和接種疫苗是有必要的。
如6.2.2所示 ,降低 β 、 k 、 γ 、 μ \beta、k、\gamma、\mu β、k、γ、μ,可以有效降低總確診人數(shù)。
目前beta的值為0.014419668870111,gamma的值為0.001492483739052,最終確診人數(shù)為2.6億人,如果 β \beta β 能降低到0.01,最終確診人數(shù)將降低到1.8億人,可顯著減少確診人數(shù)。降低感染系數(shù),首要的措施就是戴口罩,將易感人群和感染者隔離開。同時(shí)提高治愈率,這需要生物醫(yī)學(xué)的發(fā)展以及政府的資金補(bǔ)助,當(dāng) γ \gamma γ 同時(shí)提高到0.01時(shí),最終確診人數(shù)將降到1.0億,確診人數(shù)顯著減少。
參考文獻(xiàn)
[1] 張發(fā),李璐,宣慧玉. 傳染病傳播模型綜述[J]. 系統(tǒng)工程 理論與實(shí)踐,2011,31( 9) : 1736 - 1744.
[2]須成杰,覃開舟.基于SEIR模型的新型冠狀病毒肺炎疫情分析[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(12):87-90.(主要)
[3]李靜,高媛,黃家妹.基于改進(jìn)SEIR模型的COVID-19疫情傳播建模[J].中北大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,42(06):486-494.
[4]陳興志,田寶單,王代文,黃飛翔,付凌燕,徐浩瑩.基于SEIR模型的COVID-19疫情防控效果評估和預(yù)測[J].應(yīng)用數(shù)學(xué)和力學(xué),2021,42(02):199-211.
[5]張杰豪,陳永雪,申佳瑜,張慧,溫永仙.信息效應(yīng)下SEIR傳染病模型的動(dòng)力學(xué)分析[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2021,51(11):316-323.
[6]楊真真,謝艷秋,靳旭東,莊桂敏.基于ARIMA時(shí)間序列模型的傳染病發(fā)展趨勢預(yù)測——以COVID-19為例[J].中國科技信息,2021(Z1):70-72.
[7]李靜,高媛,黃家妹.基于改進(jìn)SEIR模型的COVID-19疫情傳播建模[J].中北大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,42(06):486-494.
[8]鐘德炎,陳麗華,吳榮火.新型冠狀病毒肺炎(COVID-19)疫情預(yù)測——基于殘差自回歸模型[J].內(nèi)江科技,2021,42(05):118-119.
[9]謝曉金,羅康洋,張怡,金建炳,林海翔,殷志祥,王國強(qiáng).非線性組合動(dòng)態(tài)傳播率模型與我國COVID-19疫情分析和預(yù)測[J].運(yùn)籌學(xué)學(xué)報(bào),2021,25(01):17-30.DOI:10.15960/j.cnki.issn.1007-6093.2021.01.002.
[10]劉雅姝,吳琪俊,陸一涵,趙玉虹.新型冠狀病毒肺炎(COVID-19)傳染病預(yù)測模型分析[J].公共衛(wèi)生與預(yù)防醫(yī)學(xué),2020,31(03):10-13.
[11]白寧,宋晨瑋,徐瑞.基于動(dòng)力學(xué)模型的COVID-19疫情預(yù)測與控制策略研究[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),2020,43(03):483-493.
[12]林俊鋒.基于引入隱形傳播者的SEIR模型的COVID-19疫情分析和預(yù)測[J].電子科技大學(xué)學(xué)報(bào),2020,49(03):375-382.
[13]曹盛力,馮沛華,時(shí)朋朋.修正SEIR傳染病動(dòng)力學(xué)模型應(yīng)用于湖北省2019冠狀病毒病(COVID-19)疫情預(yù)測和評估[J].浙江大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2020,49(02):178-184.
[14]王志心,劉治,劉兆軍.基于機(jī)器學(xué)習(xí)的新型冠狀病毒(COVID-19)疫情分析及預(yù)測[J].生物醫(yī)學(xué)工程研究,2020,39(01):1-5.DOI:10.19529/j.cnki.1672-6278.2020.01.01.
[15]喻孜,張貴清,劉慶珍,呂忠全.基于時(shí)變參數(shù)-SIR模型的COVID-19疫情評估和預(yù)測[J].電子科技大學(xué)學(xué)報(bào),2020,49(03):357-361.
附錄
附錄1——使用的工具和軟件
Python & MATLAB文章來源:http://www.zghlxwxcb.cn/news/detail-415307.html
附錄2——代碼
附錄2.1 |
---|
簡介: python爬蟲獲取美國COVID-19疫情感染人數(shù) 數(shù)據(jù)來源:https://www.worldometers.info/coronavirus/country/us/ 源碼在get_data.py文件 運(yùn)行后獲取true data.csv文件 |
附錄2.2 |
---|
簡介: matlab擬合參數(shù)及預(yù)測美國COVID-19疫情感染人數(shù) 完整導(dǎo)出數(shù)據(jù)以及繪圖代碼在predict.m文件 optimize.m 為 fmincon優(yōu)化的目標(biāo)函數(shù) SEIR.m為SEIR模型函數(shù) 運(yùn)行后獲取predict data.csv文件、relative error.csv文件以及比較圖 |
轉(zhuǎn)載自基于SEIR模型對美國COVID-19疫情傳播的預(yù)測和分析|易安的小窩
鏈接:https://jingblog.tech/2022/09/22/mei-guo-xin-guan-yi-qing-yu-ce/文章來源地址http://www.zghlxwxcb.cn/news/detail-415307.html
到了這里,關(guān)于基于SEIR模型對美國COVID-19疫情傳播的預(yù)測和分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!