正在阅读:

哈佛公布新算法:提前2周预测疫情爆发

扫一扫下载界面新闻APP

哈佛公布新算法:提前2周预测疫情爆发

这一指标的搭建融合了来自搜索引擎、社交媒体及手机定位等多个不同来源的数据流,并可提前两周左右预测疫情爆发。

图片来源:图虫

实习记者 | 金亭藩

编辑 | 马蕾

复工期间,最令人担心的事情恐怕就是疫情复发了。哈佛团队一项最新研究显示,通过对社交媒体、搜索引擎、移动轨迹等数据流的分析,可以搭建一个实时预测疫情复发的新算法。

7月1日,由哈佛大学Mauricio Santillana教授带领的研究团队在预印平台arXiv上发表了一项研究,并展示了一种由大数据分析驱动的用于预测美国各州新冠疫情的综合性指标,可提前两周左右预测疫情爆发。

这篇论文的标题为《一种利用多个数据追踪近乎实时监测新冠肺炎活动的预警方法》(An Early Warning Approach to Monitor COVID-19 Activity with Multiple Digital Traces in Near Real-Time)。研究团队中还有来自马里兰大学、斯坦福大学、萨尔茨堡大学等不同高校、研究机构及企业的国际科学家。目前,这一论文还没有通过同行评审,尚未正式发表。

同大多数进行预先假设的传染病模型不同,这篇论文提出的预测方式主要是通过观察各地疫情数据和社交媒体、关键词搜索以及手机定位等不同实时数据流之间的关系,并通过概率计算和统计模型对这些数据进行综合得到的。因而,这一算法可以对人们的即时行为变化进行反应,并将其纳入到疫情预测之中。

该研究总共分析了六种信息流,分别是:新冠相关关键词搜索的谷歌趋势,新冠相关的Twitter活动,UpToDate平台上新冠相关的医生搜索活动,GLEAM流行病学模型预测,由智能手机获取的匿名移动活动数据,以及Kinsa智能温度计测量数据。通过综合这六种信息流得到的指标对新冠肺炎确诊病例增加预测的提前时间中值为19.5天,而对新冠肺炎死亡病例增加预测的提前时间中值为29天。

研究人员认为,这一指标可以为政策制定者提供有价值的实时信息,并可以在复工过程中起到制热或制冷系统中温度调控器的作用。例如,在复工过程中,根据这一指标提供的实时信息进行预警,可以随时调整公共卫生干预措施在不同时间段的启动、强化或放松,更灵活地应对疫情变化,避免复工阶段疫情产生二次爆发。

2008年由谷歌推出的Google Flu产品可以看作是使用实时数据进行疫情分析的第一次尝试。这种产品的算法主要基于关键字搜索数据进行搭建,但由于数据来源过于单一,在现实中的表现并不好。自此之后,科学家们便开始尝试综合不同的数据流来开发更好的预测算法。

大数据分析是否能够在疫情预测中起到重要作用,目前也存在着许多争议。美国疾病控制与预防中心虽然在分析过程中已经开始参考包括社交媒体在内的实时数据,但并未将它们看作是疫情预测的核心指标。这些算法是否能够成为有效的预测模型,还有待现实的检验与验证。不过,新冠疫情持续发展带来的对疫情预测的需求和大量数据的产生,或许将为它们提供机会。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

哈佛公布新算法:提前2周预测疫情爆发

这一指标的搭建融合了来自搜索引擎、社交媒体及手机定位等多个不同来源的数据流,并可提前两周左右预测疫情爆发。

图片来源:图虫

实习记者 | 金亭藩

编辑 | 马蕾

复工期间,最令人担心的事情恐怕就是疫情复发了。哈佛团队一项最新研究显示,通过对社交媒体、搜索引擎、移动轨迹等数据流的分析,可以搭建一个实时预测疫情复发的新算法。

7月1日,由哈佛大学Mauricio Santillana教授带领的研究团队在预印平台arXiv上发表了一项研究,并展示了一种由大数据分析驱动的用于预测美国各州新冠疫情的综合性指标,可提前两周左右预测疫情爆发。

这篇论文的标题为《一种利用多个数据追踪近乎实时监测新冠肺炎活动的预警方法》(An Early Warning Approach to Monitor COVID-19 Activity with Multiple Digital Traces in Near Real-Time)。研究团队中还有来自马里兰大学、斯坦福大学、萨尔茨堡大学等不同高校、研究机构及企业的国际科学家。目前,这一论文还没有通过同行评审,尚未正式发表。

同大多数进行预先假设的传染病模型不同,这篇论文提出的预测方式主要是通过观察各地疫情数据和社交媒体、关键词搜索以及手机定位等不同实时数据流之间的关系,并通过概率计算和统计模型对这些数据进行综合得到的。因而,这一算法可以对人们的即时行为变化进行反应,并将其纳入到疫情预测之中。

该研究总共分析了六种信息流,分别是:新冠相关关键词搜索的谷歌趋势,新冠相关的Twitter活动,UpToDate平台上新冠相关的医生搜索活动,GLEAM流行病学模型预测,由智能手机获取的匿名移动活动数据,以及Kinsa智能温度计测量数据。通过综合这六种信息流得到的指标对新冠肺炎确诊病例增加预测的提前时间中值为19.5天,而对新冠肺炎死亡病例增加预测的提前时间中值为29天。

研究人员认为,这一指标可以为政策制定者提供有价值的实时信息,并可以在复工过程中起到制热或制冷系统中温度调控器的作用。例如,在复工过程中,根据这一指标提供的实时信息进行预警,可以随时调整公共卫生干预措施在不同时间段的启动、强化或放松,更灵活地应对疫情变化,避免复工阶段疫情产生二次爆发。

2008年由谷歌推出的Google Flu产品可以看作是使用实时数据进行疫情分析的第一次尝试。这种产品的算法主要基于关键字搜索数据进行搭建,但由于数据来源过于单一,在现实中的表现并不好。自此之后,科学家们便开始尝试综合不同的数据流来开发更好的预测算法。

大数据分析是否能够在疫情预测中起到重要作用,目前也存在着许多争议。美国疾病控制与预防中心虽然在分析过程中已经开始参考包括社交媒体在内的实时数据,但并未将它们看作是疫情预测的核心指标。这些算法是否能够成为有效的预测模型,还有待现实的检验与验证。不过,新冠疫情持续发展带来的对疫情预测的需求和大量数据的产生,或许将为它们提供机会。

未经正式授权严禁转载本文,侵权必究。