大数据挖掘会让我们避免下一场瘟疫么?

  文/南七道

  当下一场变异性流感等流行病大规模爆发之前,通过周围的大数据监测和预测周边疫情动态,人们再也不必恐慌和担心被传染,早就有相应提示及时应对预防;而与此密切相关的医疗行业,可以及时获悉疾病爆发趋势,合理分配和部署好医务人员,同时提醒和建议市民预防疫病,降低人们染病几率……

这一幕将不仅仅只出现在好莱坞的科技大片里。事实上,未来真正的大数据积累应该是可以提前预测人的疾病情况,因为疾病不是一天出现的,而是天长日久累计出来的,各种数据一定发生变化。所以在大数据之上的慢数据才是真正有价值的,那么,究竟大数据和慢数据会对我们的生活产生什么样的影响呢?

  挖掘“慢数据”的价值

现在每天产生大量数据,但很多是没有价值的数据,这些数据没有显示出足够的威力。纵观相关行业里,医疗行业尤其是流行病的疾控和预警是表现最为明显的也是最需要急切的,因为健康和每个人、每个家庭、每个城市、每个国家都息息相关。

例如我们每天刷牙,如果能够通过牙刷等人工智能设备收集唾液的一些样本,通过体温等指标这样的“慢数据”才具有医学和参考价值。医学领域“生理数据”比“物理数据”更有实用价值。

  疾控现状:

由于现代医学技术的高度发达和迅猛发展,在大多数人心里,大规模流行病的发生好像是很遥远的事。但事实证明,它从不曾离我们远去。

据世界卫生组织数据,在2009年发生的那场H1N1流感(国内又称猪流感)里,全球造成至少12220人死亡,一周内新增死亡人数704人,全球股市因此下跌10%左右。

有数据显示,在全球,随着人口增长和日益加快的城市化进程致使数亿人居住环境卫生恶化,疾病随着人口的增长以及人们向拥挤的城市迁移而肆虐。容易在人群中传播的疾病如流感都容易在城市中流行。

在这其中,中国是表现最为明显的国家之一,由于人口众多,随着经济的发展,人员跨区域流动性加大、城市化加剧、城市人口密度增加、结构变化等都加剧了流行病发生、传播、蔓延的几率及传播速度。同时科学技术的进步、医疗手段的提高、抗生药物等广泛使用,也加速了病毒、细菌等病原体的扩散、变异和进化,出现一系列新的致命新病原体感染传播。

过去十多年发生的各种大规模流行病历历在目:SARS、甲型H1N1流感、手足口病、H7N9禽流感等,几乎每隔一段时间,流行病就会以不同的形式卷土重来一次。

去年卫生部发言人就曾提到:“中国面临传统流行病威胁持续存在、新发流行病不断出现的严峻形势。”基于原有监控系统和流程的卫生防疫系统已经有些力不从心跟不上节奏,基于互联网大数据的流行病监测就变得非常重要且非常紧迫。

美国管理咨询公司麦肯锡全球研究院(MGI)预测,如果美国的医疗行业能够有效利用不断增长的大数据来提高效率和质量,那么每年可创造超过3000亿美元的额外价值,可以挽救无数本可不应该失去的生命。

  如何监控预防:

我们应该如何利用现代科技和互联网技术避免下一场H1N1的发生呢?大数据可以做到吗?

  首先发现:在基于海量使用用户搜索、社交app、LBS等产生的大数据,还有用户人口统计学等数据,结合原有疾病监控系统中的流行疾病法定报告数据、流行疾病病例,结合疾病、环境数据,及时发现并绘制出流行病风险地图。

比如,国内H1N1最早发现于广东地区,当这个地区搜索发热等关键词超过一定数量时,结合医院和疾控中心的流行病监控等数据,就能很快发现并定位新的流行病的发生及相关情况评估。

  确定情况:在基于搜索数据和LBS数据,分析不同时空尺度人口流动性、移动模式和参数进一步结合病原学、人口统计学、地理、气象和人群移动迁徙、地域之间等因素和信息,建立流行病时空传播模型,确定流感等流行病在各流行区域间传播的时空路线和规律,得到更加准确的态势评估、预测。

同时机器学习(machine learning)和人工智能等技术的发展,促进了流行病监测、传播动力学研究和风险评估,并成为传统分析方式的有效增强和升级,更加准确的判断下一场流行病的发生区域等信息。

  预警及应对:结合LBS、社交app相关信息,从更加微观尺度上更加精准的进行流行病监测和预测,同时通过权威途径及时告知流行病的发展状况和预防措施,让用户了解周边流行病活动真实情况,为生活提供可信参考,避免传谣信谣,以便及时采取疫苗接种等预防措施。公共卫生、医疗机构、卫生行政部门人员将更容易获取各类疾病发生风险的动态分析结果,促进医疗人员、疫苗等资源优化和配置,有力的阻击病毒和事态的进一步恶化和扩撒,成功的避免下一次大规模的流行病的发生。

著名的《大数据时代》(维克托·迈尔-舍恩伯格、肯尼思·库克耶著)里就记载了谷歌怎么用大数据来预测病毒爆发的:2009年爆发了新的流感病毒,如果按照原有处理流程是这样的:医生发现病例——报告疾控中心——公共卫生专家分析信息——采取应对措施,但是在这个流程中会存在信息和数据滞后,这种滞后导致公共卫生机构在疫情爆发的关键时期反而无所适从。

谷歌通过建立在大数据的基础上完美的解决了这个问题,它通过观察人们在网上的搜索记录来完成这个预测,它保存了多年来所有的搜索记录,而且每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。通过对海量数据进行分析,获得以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。这就是大数据的力量和魅力。

相信随着大数据和慢数据挖掘、人工智能技术的发展,成功预测并避免下一次瘟疫不再是梦想!

——————————————-

南七道:前创新工场项目负责人,移动互联网创业者

您可能还喜欢…

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>