携手数据分析,构筑智能化的疫情预测预警系统
扫描二维码
随时随地手机看文章
疫情预测预警是有效应对传染病重要的手段,传染病预测预警是通过建立统计分析和数学模型的建立,探讨传染病发生、发展和流行的规律,一方面可根据预测的数据,有的放矢地提出和采取预防控制措施,并通过跟踪印证来评价预防措施的效果,能使预防控制工作更具针对性、预见性和主动性,从而达到防止暴发或流行的目的;另一方面可将实时疫情信息与同期历史资料比较,对于发病率超出所确定可信限范围者作为异常来处理,以此发出暴发或流行的警示,从而实现疾病的早期预警。
用于传染病预测预警的方法分为定性预测和定量预测,定性预测主要包括流行控制图法、比数图法、模糊数学理论以及动态图形法等。现在应用越来越广泛的方法之一是动态图形法。
动态图形是一种随着计算机技术的成熟而快速发展起来的图形基础,它既继承了传统统计图形的所有要素和优点,又增添了更加丰富的表达形式(如拖拉点拽式的操作界面、动画电影般的显示效果等),从而能够灵活自如地从更多维度地展现数据背后的内在规律和发展趋势。使用门槛低,易于理解,统计沟通的效果更佳。
而定量预测主要有灰色动态模型、回归预测模型、逐步判别模型、多元回归模型以及时间序列模型等。目前应用比较成熟的方法之一是时间序列分析模型。
时间序列分析是一种处理时间维度数据的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。它克服了因果回归分析法中预测对象的影响因素难以掌握和数据资料不易得到的难题,利用任何事物的发展都具有一定惯性的原理,建立时间序列模型,以达到预测未来的目的。过程简便、经济、适用,短期预测精度较高。
下面基于专业统计分析软件JMP,分别用一些实际案例进行说明。
案例一——禽流感全球疫情监控
禽流感常指人感染禽流感,是由禽流感病毒引起的人类疾病。由于禽流感病毒的血凝素结构等特点,当病毒在复制过程中发生基因重配,致使结构发生改变,获得感染人的能力,才可能造成人感染禽流感疾病的发生。至今发现能直接感染人的禽流感病毒亚型有:H5N1、H7N1、H7N2、H7N3、H7N7、H9N2和H7N9亚型。其中高致病性的禽流感,不仅会重创家禽养殖业,而且会造成人类社会的巨大伤亡。
利用联合国卫生组织公布的数据,对2009年5月起首次引起全球关注的禽流感疫情进行早期的定性分析与预测,发现了很多有意义的规律和特征。图1就是运用JMP软件中的“气泡图”平台绘制而成的动态图形。根据气泡的大小、颜色和运动轨迹,我们不难发现墨西哥和美国是当时疫情最严重的两个国家,而它们的特点又有所不同:墨西哥的病例数量不是最多,但死亡率很高;美国的病例数量最多,但死亡率相对较低。
此外,再结合地理信息系统的内容,我们可以更广泛地了解此次禽流感疫情在全球范围内的变化规律。图2就是进一步运用JMP软件中的“地图”功能绘制而成的动态图形。我们可以轻而易举地跨越时空的局限,将世界各地的禽流感疫情一览无遗。
案例二——国内某省丙肝发病的预测
丙肝,全名为丙型病毒性肝炎。虽然丙肝的“知名度”不如乙肝,但近几年丙肝的发病率逐年上升。丙肝不像乙肝症状明显,因而多数丙肝患者本身并不知情。但是,在未来20年内与HCV感染相关的死亡率(肝衰竭及肝细胞癌导致的死亡)将继续增加,对患者的健康和生命危害极大,已成为我国严重的社会和公共卫生问题。
利用某省2005-2013年的丙肝报告发生数预测该省2014年的丙肝情况。图3中展示了108个月的该省丙肝报告发生数。
观察上图发现,该数据具备趋势性、周期性和随机性的特点,适合用时间序列分析中的ARIMA(p,d,q)模型来进行分析预测。但是,如何确定其中的参数p,d,q呢?这需要具备一定的统计学背景知识,花费相当的探索与尝试时间。幸运的是,在JMP软件的智能化分析帮助下,这一切变得很简单,因为可以在极短的时间内对大量的候选模型进行地毯式搜索,并根据其拟合效果的优劣进行排序,最后甄选出一个预测误差最小的模型供我们参考使用。本例中最终确定的参数为p=1,d=1,q=1,因此对应的ARIMA模型为ARIMA(1,1,1)。用该模型对源数据进行拟合及预测,如图4所示,该模型曲线的拟合效果还是不错的。
相信大家从这些案例中可以感受到:工欲善其事,必先利其器。借助于现代化的数据分析利器JMP,无论是定性预测,还是定量预测,都能够简便高效地完成。未来这些方法和技术在传染病预测预警方面还会有更好的应用前景。