高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

流感数据与特定关键词相关性分析及预测

李乐 周子豪 吴群红 孟祥伟 齐新业 王星 邵瑛琦 李晨希

李乐, 周子豪, 吴群红, 孟祥伟, 齐新业, 王星, 邵瑛琦, 李晨希. 流感数据与特定关键词相关性分析及预测[J]. 中国公共卫生, 2021, 37(12): 1813-1818. doi: 10.11847/zgggws1132684
引用本文: 李乐, 周子豪, 吴群红, 孟祥伟, 齐新业, 王星, 邵瑛琦, 李晨希. 流感数据与特定关键词相关性分析及预测[J]. 中国公共卫生, 2021, 37(12): 1813-1818. doi: 10.11847/zgggws1132684
LI Le, ZHOU Zi-hao, WU Qun-hong, . Association of specific keywords index in Baidu website with influenza monitoring data during 2012 – 2020 and potential use of the index for influenza epidemic prediction[J]. Chinese Journal of Public Health, 2021, 37(12): 1813-1818. doi: 10.11847/zgggws1132684
Citation: LI Le, ZHOU Zi-hao, WU Qun-hong, . Association of specific keywords index in Baidu website with influenza monitoring data during 2012 – 2020 and potential use of the index for influenza epidemic prediction[J]. Chinese Journal of Public Health, 2021, 37(12): 1813-1818. doi: 10.11847/zgggws1132684

流感数据与特定关键词相关性分析及预测

doi: 10.11847/zgggws1132684
基金项目: 国家医疗保障基金(19AZD013)
详细信息
    作者简介:

    李乐(1995 – ),男,河南人,硕士在读,研究方向:社会医学

    通讯作者:

    吴群红,E-mail:wuqunhong@163.com

  • 中图分类号: R 181.8

Association of specific keywords index in Baidu website with influenza monitoring data during 2012 – 2020 and potential use of the index for influenza epidemic prediction

  • 摘要:   目的  分析我国流感相关关键词的百度指数与流感相关数据的相关性的变化趋势,探究以不同关键词构建流感预测模型的预测效果。  方法  从全球流感监测与应对网络(GISRS)收集2012年第1周 — 2020年12周共429周的每周确诊的流感阳性病毒数据;用筛选的到的关键词从百度指数数据库(http://index.Baidu.com/)收集全国2012年第1周 — 2020年12周各关键词的每日百度指数。以我国流感爆发规模明显改变的时间(2017年)为节点,应用SPSS 22.0软件计算关键词百度指数在节点前后与流感数据的相关系数,并应用Eviews 8软件来构建相应关键词与流感数据的多元线性回归模型。  结果  2017年以前关键词百度指数与周流感阳性病例数的相关系数 > 0.5的有18个,2017年以后有30个,其中28个关键词是2017年后相关性要高;2017年前相关性最高的前4位关键词是甲流是什么、流行性感冒、甲型流感、发烧,2017年后相关系数最高的为甲流的症状、流感症状、流感吃什么药、泰诺;在新冠疫情的背景下,自变量含有“高烧”非特异性关键词的回归模型预测结果偏高,替换为特异性关键词后预测偏差降低。  结论  我国基于网络大数据监测的流感相关关键词范围不断扩大,相关性也有所提高;公众通过网络进行流感信息获取逐渐从流感的概念向流感的症状和治疗方面转移;在通过关键词监测流感时应及时更新选词同时选择特异性更高的词作为监测对象。
  • 图  1  我国流感病毒阳性病例检出趋势图

    图  2  模型预测图

    表  1  关键词初选结果及编号

    名称(N)风热感冒(N16)怎样预防流感(P7)感冒清热颗粒(T5)发热门诊(T21)头痛(S13)
    流行性感冒(N1) 肠胃感冒(N17) 流感的预防措施(P8) 奥司他韦(T6) 流感治疗(T22) 感冒咳嗽(S14)
    流感(N2) 伤风感冒(N18) 流感防治知识(P9) 奥司他韦颗粒(T7) 甲型流感第几天最严重(T23) 喉咙痛(S15)
    季节性流感(N3) 伤风(N19) 怎么判断是不是流感(P10) 达菲(T8) 症状(S) 咽喉痛(S16)
    新型流感(N4) H5N1(N20) 禽流感潜伏期(P11) 莲花清瘟胶囊(T9) 流感症状(S1) 咽痛(S17)
    乙型流感(N5) H7N9禽流感(N21) 流感传播途径(P12) 感冒药有哪些(T10) 猪流感症状(S2) 咽喉肿痛(S18)
    病毒性流感(N6) 禽流感(N22) 预防流感小常识(P13) 风寒感冒吃什么药(T11) 禽流感症状(S3) 流鼻涕(S19)
    流感嗜血杆菌(N7) 禽流感病毒(N23) 流感最新消息(P14) 风热感冒吃什么药(T12) 感冒症状(S4) 鼻塞(S20)
    甲流(N8) 猪流感(N24) 禽流感新闻(P15) 喉咙痛吃什么好(T13) 风寒感冒症状(S5) 流鼻涕打喷嚏(S21)
    甲型流感(N9) 预防(P) 流感疫情(P16) 喉咙痛吃什么药(T14) 甲型流感症状(S6) 感冒流鼻涕(S22)
    甲流是什么(N10) 流感疫苗(P1) 流感大流行(P17) 喉咙痛怎么办(T15) 甲流的症状(S7) 咳嗽(S23)
    甲型H1N1流感(N11) 甲型流感疫苗(P2) 治疗(T) 咳嗽吃什么药(T16) 流感和普通感冒的区别(S8) 咳嗽有痰(S24)
    甲型流感病毒(N12) 流感疫苗有必要打吗(P3) 感冒药(T1) 咳嗽治疗(T17) 体温(S9)
    H1N1(N13) 流感疫苗的副作用(P4) 白加黑(T2) 流鼻涕打喷嚏吃什么药(T18) 发烧(S10)
    感冒(N14) 流感疫苗价格(P5) 感康(T3) 流感吃什么药(T19) 高烧(S11)
    风寒感冒(N15) 流感预防(P6) 泰诺(T4) 伤风感冒吃什么药(T20) 发热(S12)
    下载: 导出CSV

    表  2  我国流感数据与特定关键词最佳相关系数表

    关键词2012.1 — 2016.522017.1 — 2020.12关键词2012.1 — 2016.522017.1 — 2020.12
    先行周数(周)相关系数先行周数(周)相关系数先行周数(周)相关系数先行周数(周)相关系数
    N1 0 0.680 0 0.483 T6 0 0.608 0 0.795
    N2 0 0.220 0 0.513 T8 0 0.107 0 0.748
    N6 0 0.582 0 0.662 T9 0 0.427 0 0.510
    N8 2 0.215 0 0.754 T10 10 0.343 8 0.667
    N9 0 0.659 0 0.781 T11 6 0.626 1 0.584
    N10 0 0.720 1 0.755 T15 0 0.075 0 0.588
    N12 0 0.615 0 0.679 T19 0 0.460 0 0.854
    N14 2 0.535 0 0.681 T22 0 0.524 0 0.524
    N15 5 0.636 0 0.635 S1 0 0.476 0 0.861
    P6 0 0.408 1 0.806 S6 0 0.629 1 0.712
    P7 0 0.378 0 0.765 S7 2 0.249 0 0.883
    T1 2 0.418 1 0.674 S10 0 0.646 0 0.701
    T2 1 0.470 0 0.636 S11 1 0.542 0 0.820
    T3 2 0.565 0 0.588 S19 6 0.530 0 0.438
    T4 1 0.609 0 0.852 S20 5 0.522 0 0.655
    T5 8 0.525 0 0.701 S23 1 0.489 0 0.655
    下载: 导出CSV

    表  3  流感阳性确诊病例先行一周与关键词的相关系数表

    关键词相关系数关键词相关系数关键词相关系数
    甲流的症状(S7) 0.865 流感吃什么药(T19) 0.750 发烧(S10) 0.650
    流感治疗(T22) 0.839 奥司他韦(T6) 0.729 甲型流感病毒(N12) 0.644
    流感症状(S1) 0.815 甲流(N8) 0.722 白加黑(T2) 0.630
    泰诺(T4) 0.810 甲型流感症状(S6) 0.712 风寒感冒(N15) 0.623
    高烧(S11) 0.808 感冒清热颗粒(T5) 0.693 咳嗽(S23) 0.613
    流感预防(P6) 0.806 达菲(T8) 0.687 风寒感冒吃什么药(T11) 0.585
    怎样预防流感(P7) 0.785 感冒药(T1) 0.674 喉咙痛怎么办(T15) 0.570
    甲流是什么(N10) 0.755 感冒(N14) 0.662 感康(T3) 0.555
    甲型流感(N9) 0.752 鼻塞(S20) 0.652 病毒性流感(N6) 0.551
      注:只显示相关系数 > 0.5的关键词。
    下载: 导出CSV

    表  4  多元回归模型参数估计和模型检验

    变量 系数 标准误差 t P 可决系数 F 检验
    模型1
    流感阳性例数 0.899 0.049 18.274 0.000 0.954 0.000
    甲流是什么 1.640 0.308 5.322 0.000
    高烧 1.897 0.468 4.051 0.000
    流感治疗 4.041 1.235 3.272 0.001
    甲流的症状 – 4.823 0.644 – 7.489 0.000
    常数项 – 929.530 251.232 – 3.700 0.000
    模型2
    流感阳性例数 0.874 0.049 17.659 0.000 0.927 0.000
    甲流是什么 0.734 0.233 3.149 0.002
    奥司他韦 – 0.034 0.021 – 1.663 0.086
    达菲 0.086 0.069 1.250 0.214
    常数项 6.643 69.580 0.095 0.924
    下载: 导出CSV
  • [1] 徐元英. 流感高发季, 高危人群如何防治[J]. 家庭医药. 快乐养生, 2020(4): 55.
    [2] 沙小兰, 李燕, 刘小娟, 等. 2009 — 2018年银川市流行性感冒流行特征及发病趋势预测[J]. 中华疾病控制杂志, 2020, 24(8): 881 – 885, 928.
    [3] 王若佳. 融合百度指数的流感预测机理与实证研究[J]. 情报学报, 2018, 37(2): 206 – 219.
    [4] 顾敏华, 姚建香, 汤玲. 特定关键词的百度指数与流感病毒活动相关性分析[J]. 职业与健康, 2019, 35(8): 1124 – 1128.
    [5] 董晓春, 李琳, 徐文体, 等. 特定关键词及百度指数与流感病毒活动相关性分析[J]. 中国公共卫生, 2016, 32(11): 1543 – 1546.
    [6] 白宁, 郁磊, 靳祯. 基于百度指数的人感染H7N9禽流感疫情预测[J]. 公共卫生与预防医学, 2018, 29(6): 8 – 12.
    [7] Liu BY, Wang Z, Qi XH, et al. Assessing cyber-user awareness of an emerging infectious disease: evidence from human infections with avian influenza A H7N9 in Zhejiang, China[J]. Int J Infect Dis, 2015, 40: 34 – 36. doi: 10.1016/j.ijid.2015.09.017
    [8] Liang F, Guan P, Wu W, et al. Forecasting influenza epidemics by integrating internet search queries and traditional surveillance data with the support vector machine regression model in Liaoning, from 2011 to 2015[J]. PeerJ, 2018, 6: e5134. doi: 10.7717/peerj.5134
    [9] 王大燕. 中国流感监测网络的发展与展望[J]. 中华流行病学杂志, 2018, 39(8): 1036 – 1040.
    [10] Yuan QY, Nsoesie EO, Lv BF, et al. Monitoring influenza epidemics in China with search query from Baidu[J]. PLoS One, 2013, 8(5): e64323. doi: 10.1371/journal.pone.0064323
    [11] 付晓霞. 基于Lotka-Volterra模型的中国网民数量预测及其行为研究[D]. 合肥: 中国科学技术大学, 2018.
    [12] 胡亚谦. 大数据预测能力对公共决策的影响[J]. 东北大学学报(社会科学版), 2016, 18(3): 281 – 287.
    [13] 孙树梅. 关注儿童流感, 重视疫苗接种 —— AAP感染性疾病委员会《儿童流感的预防与控制建议(2018 — 2019年)》解读[J]. 中国全科医学, 2019, 22(6): 621 – 626.
    [14] 李妮, 唐争艳. 乡镇居民对突发公共卫生事件及常见传染病的认知与健康需求[J]. 灾害学, 2020, 35(4): 33 – 37.
    [15] 胡佳, 田向阳, 陈继彬, 等. 中国3省居民传染病健康素养现状及影响因素分析[J]. 中国公共卫生, 2020, 36(2): 183 – 187.
    [16] 徐亮, 阮晓雯, 李弦, 等. 人工智能在疾病预测中的应用[J]. 自然杂志, 2018, 40(5): 349 – 354.
    [17] 汪宏波, 熊占路, 张可可, 等. “网格化 + 家庭医生”实现重大传染病超前预警[J]. 国家治理, 2020(20): 32 – 38.
    [18] 祝丙华, 王立贵, 孙岩松, 等. 基于大数据传染病监测预警研究进展[J]. 中国公共卫生, 2016, 32(9): 1276 – 1279.
  • 加载中
图(2) / 表(4)
计量
  • 文章访问数:  170
  • HTML全文浏览量:  64
  • PDF下载量:  26
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-10-09
  • 网络出版日期:  2021-08-12
  • 刊出日期:  2021-12-13

目录

    /

    返回文章
    返回