我们都想忘记 COVID-19 带来的悲伤和破坏。但是,可悲的是,像重大流行病这样的公共卫生问题在未来可能会变得更加频繁:2021 年的一项研究分析了以往疾病爆发的数据,发现新型大流行病感染人类的发生率正在上升。更重要的是,未来几十年爆发的风险将增加两倍。
“人们可能会错误地认为,在经历另一次这样的事件之前,可以再等 100 年,”杜克大学研究员、该研究的作者之一 Gabriel Katul 在一份声明中表示。“这种想法是错误的。”
提高大流行病防范意识的需求显而易见。幸运的是,数据科学家已经承担了这项任务。他们正在深入挖掘社交媒体平台和搜索引擎的潜力,以预测传染病的传播轨迹,这可能有助于当局更有效地遏制未来大流行病的传播,并更好地管理流感等季节性健康问题。
社交媒体如何帮助预测健康趋势?
研究强调,来自 Google 和 X(以前称为 Twitter)等平台的聚合数据可以显示与流感样症状(或与病毒性疾病相关的关键词)相关的搜索查询量,并预示区域性疫情的爆发。目标是利用这些数字足迹作为即将到来的健康危机的早期指标。
例如,2023 年的一项研究使用机器学习技术检查了 X 上的 130 万条帖子,以分析其中提及莱姆病的潜在内容在美国。该计算机算法能够以 90% 的准确率确定哪些推文在谈论莱姆病。
阅读更多:什么是莱姆病?为什么病例正在增加?
科学家们是如何利用这些数据的?
正是这种数据,科学家们希望用它来预测潜在的疾病传播。事实上,他们已经在这样做了,但利用这些数据比仅仅显示许多人在推特上或在 Google 上搜索某些相关关键词要复杂得多。
计算机模型需要考虑各种额外的变量,例如人们在一座城市或国家内的流动倾向、给定疾病的潜伏期——即在接触病原体后变得传染所需的时间——以及疫苗接种率。这是一个复杂的问题,但研究开始显示出成果。
在 2022 年发表于《应用软计算》杂志的一项研究中,研究人员通过社交媒体帖子回顾性预测了 COVID-19 的传播,准确率超过 90%。
阅读更多:人工智能将如何永远改变医学
这能否帮助预防未来的疾病爆发?
关键挑战在于将这些模型从概念验证(即科学家分析过去的疫情以证明模型有效)转变为预测和预防未来疾病。这要困难得多,因为在疫情爆发之前,我们往往不知道我们想了解的关于一种新型疾病的所有信息,例如它的潜伏期。
因此,这些模型的预测能力取决于复杂的算法和机器学习技术,它们可以筛选海量数据以提供最佳猜测。通过辨别这些数据集中的模式和细微差别,研究人员希望能在健康问题出现在官方数据之前就预测到它们。
阅读更多:如果我们能忍受疾病会怎样?
使用社交媒体数据预测疾病面临哪些挑战?
尽管如此,决策者首先需要接受这些新技术。即使那样,关于用户隐私的伦理考量也构成了严峻的挑战。几项研究强调了负责任的数据使用和严格的伦理框架的必要性,以确保在利用大数据造福公共卫生监测的同时,尊重用户隐私。
随着技术的不断发展和塑造我们的世界,大数据分析和公共卫生相结合为革新疾病监测和应对策略提供了一条充满希望的途径。因此,即使大流行病在未来确实变得更加普遍,也仍有理由感到乐观。
毕竟, necessity is the mother of invention.(需求是发明之母。)
阅读更多:气候变化很可能会增加传染病的风险















