人类活动大数据驱动的新冠肺炎传染风险评估与防控

 2022-04-15

1. 对应目标

      SDG3: 确保健康的生活方式,促进各年龄段人群的福祉。



2. 成果亮点

      本案例将以新冠病毒( COVID-19)在2019年末和2020年初在粤港澳大湾区的快速传播为场景,介绍通过多源大数据驱动的传染病风险评估方法。



3. 案例背景

      各类突发性传染病的快速传播严重威胁人类的健康与社会的有序发展。 如14世纪黑死病的爆发造成了欧洲约30%‒60%的人口死亡;20世纪初的西班牙流感感染了约1/4的世界人口; 2019年至今, 新型冠状病毒在全球范围的快速传播已感染超过2.1亿的全球人口, 造成了全球经济深度衰退。 自人类社会发展以来, 各类突发性传染病一直严重威胁着我们的生命安全、 社会稳定以及全球的可持续发展。针对各类突发性传染的爆发,如何有效评估传染病的传播风险,并根据风险进行传染病防控响应,对人类健康与福祉的可持续发展至关重要。



4. 所用数据

      • 传染病统计数据:各城市CDC公布的日更新新冠病例统计数据

      • 传染病调查数据:已发表的流行病调查数据,如R0,Rt,潜伏期等

      • 人口流动数据:基于联通手机信令数据推算

      • POI数据:包括交通枢纽,超市等


5. 方法介绍

      结合时空大数据与流行病动力学模型,构建高时空分辨率传染病风险评估模型,实现COVID-19等重大突然性传染病的传播风险预测与评估,并对各类防疫管控措施效果进行量化、模拟与组合推荐。方法的技术流程如图 1 显示。

图1 多源城市大数据驱动的新冠传播风险评估技术流程

      具体地,设计传染病动力学模型、人口提取模型方法可参考之前研究(夏吉喆等,2020)。

    • 人口流动提取模型

      根据新冠病毒传播原理与其动力学模型原理,大湾区间的高强度人口流动将是新冠病毒传播的主要驱动力。大湾区人口流动OD矩阵由中国联合网络通信集团有限公司(下文简称联通)手机信令数据推算,在大湾区市场渗透率约为20%。模型运用阈值法将原始手机信令轨迹序列提取为停留点链路,具体阈值参数为:时间阈值 θt=60分钟,距离阈值 θd=500米。然后,根据停留点与不同空间尺度空间单元的拓扑关系,构建“市、区、街道/镇、社区”四个空间尺度的人口流动OD矩阵。最终根据联通在大湾区的市场渗透率进行总流动估算。

    • 传染病动力学模型

      基于经典流行病传播SEIR模型,将大湾区人口分为4个群体:S 群体为可被感染人群(如尚未感染人群);E 群体为暴露群体(如已感染但未发病确诊的人群),基于新冠病毒传播特性,E 群体同样具有传播病毒的能力;I 群体为已感染人群(如确诊病例);R 群体为撤离的人群(如已发病隔离,已治愈带有抗体或已死亡),R 群体从I群体中撤离。由多源城市大数据驱动,对经典SEIR模型基础上融合人群流动。因此,拓展其在高空间分辨率动力学的模拟和预测能力。


6. 结果

      图2展示通过手机信令数据推算的复工期间大湾区9城市51个行政区之间的日均人口流动OD矩阵(仅显示前50%流动路径)。大湾区具有明显的广州城市圈和深圳城市圈人口流动密集地区,形成突发性传染病传播的核心驱动力,也是传染病动力学模型的重要输入参数。图3显示粤港澳大湾区的多层级新冠传播风险评估结果,支撑深圳市对新冠病毒传播的科学防控,保障深圳市SDG3的可持续发展,其社会效益获得新华社《新华网》、《光明日报》、《深圳特区报》等国家地方媒体的报道。

图2 复工期间湾区间日均人口流动OD矩阵
图3 “大湾区、市、区、街道、社区”的多层级新冠传播风险评估制图

延伸阅读

Zhou Y, Xu R, Hu D, Yue Y, Li Q, Xia J. (2020). Effects of human mobility restrictions on the spread of COVID-19 in Shenzhen, China: a modelling study using mobile phone data. Lancet Digit Health, 2(8):e417-e424. doi: 10.1016/S2589-7500(20)30165-5. Epub 2020 Jul 27. PMID: 32835199; PMCID: PMC7384783.

夏吉喆, 周颖, 李珍, 李帆, 乐阳, 陈帆, 李清泉*. (2020). 城市时空大数据驱动的新型冠状病毒传播风险评估——以粤港澳大湾区为例. 测绘学报, 6, 671-680.