尽管经济的发展和医疗水平不断提高,传染病对人类的威胁并没有降低。近年来,埃
博拉病毒、登革热、中东呼吸综合征等恶性传染病频繁暴发,对人类健康、经济发展和社
会稳定构成严重威胁。2019 年 12 月底和 2020 年初暴发的新型冠状病毒肺炎(coronavirus
disease 2019,COVID-19)传染性强,影响范围广泛,引起了全世界的关注。截至 2020-
05-28,在中国境内的 COVID-19 疫情基本得到控制的情况下,其他国家的疫情呈快速大
规模扩散态势。经验表明,通过研究传染病传播规律和路径能够有效控制传染病,因此,
以多源病例活动数据为基础,通过病例的时空和语义特征研究流行病传播规律,已成为政
府和学术界关注的焦点,同时也是当今世界迫切需要解决的重大问题。
随着 COVID-19 病例数量不断增加,疫情时空传播路径变得越来越复杂。目前已有的
传染病传播规律研究主要包括利用数学传播模型和仿真传播模型方面的研究。其中,数学
传播模型的经典模型是一种常微分方程组
[1]
以及在此基础上增加的随机模型
[2]
,很多学者在
此基础上针对特定传染病的传播规律进行了研究
[3-4]
。由于数学传播模型是一种理想化的模
型,与实际存在一定差距,为克服数学传播模型的不足,有学者通过建立仿真传播模型对
传染病传播规律进行了研究
[5-7]
。然而,数学传播模型和仿真模型基于均质空间假设,主要
研究传染病例者数量随时间变化的关系,侧重数理统计分析,忽略了时空特征对传染病传
播的影响;随后,很多学者从时空演变的角度对传染病的传播趋势展开研究
[8-9]
,在时空维
度上很大地改进了传播模型。然而基于时空信息的传播模型研究主要考虑人口的空间分布
特征,而忽略了病例之间社会关系、语义关系和时序关系的表达。以上 3 种模型研究主要
是宏观上研究传染病的整体传播规律或趋势,而不能在个体层面表达具体病例之间的传播
关系,无法精准定位疫情传播路径,很难支持传染病的精准防疫。
此外,传染病医学领域引入知识图谱相关技术描述生物医学和临床医学领域相关概念
及概念之间的关系,对传染病学知识的理解和共享提供了概念模型支持
[10]
;但是从医学角
度所构建的传染病本体规则主要应用于疾病治疗的知识建模,难以在时空维度展示传染病
的传播防控过程,且无法展示病例的人群活动趋势和传播路径;因此,需要结合人群活动
事件的分析方法,从事件角度对传染病传播进行知识建模,更符合传染病传播分析的需
求。目前,以传染病为概念本体构建的医疗领域知识图谱被广泛应用于 COVID-19 防治的
研究,例如 OpenKG(http://openkg.cn/dataset/covid-19-concept)从网络文本中采集了与
COVID-19 疾病相关的实体和关系,进一步融合了百度百科、维基百科等知识库,构建了
COVID-19 概念知识图谱(http://openkg.cn/dataset/covid-19-epidemiology),重点刻画传染
病学的基本概念,为后续的研究提供了重要的理论基础。但该研究仅侧重于 COVID-19 流
行病医学角度的信息,缺少病例的时序和空间关系概念体系,无法适应大数据时代病例信
息的多样化描述方式,也难以表达病例实体的活动关系。
现有传染病传播规律的研究各具特点,已在不同领域发挥了重要作用。但传染病传播
过程与人群活动事件密切相关,即人群活动直接影响 COVID-19 的时空扩散途径;针对
COVID-19 传播时空规律分析研究主要关注统计层面分析,对于传播事件语义分析较少,
需将二者结合进一步探索传播动态演变路径。因此,亟需以传染病病例为中心,结合知识
图谱前沿技术,兼顾时空和语义特征的数据组织形式对病例数据进行建模。