大数据破解疫情——“侦探医生”斯诺的故事(内有赠书福利)
扫描二维码
随时随地手机看文章
人类用量化的方式来看待事实、记录事实,这促进了近代科学的出现。人们的生产生活也随之出现了重大的改变,很多过去无法解决的难题,也通过实验和数据得到了解决。现在,我们要讲一个医生如何通过科学实验和逻辑推理拯救生命的故事。
工业革命是人类历史上划时代的变革,它在英国发生。但你肯定很难想象,1850年前后的英国首都伦敦,作为当时全世界首屈一指的大城市,是个什么样子。毫不夸张地说,它是一个被粪坑包围、恶臭弥漫的城市。
说起来这与抽水马桶的发明有关。18世纪末,英国人发明了抽水马桶,从1800年到1850年,抽水马桶快速普及。与此同时,伦敦已经有了很好的自来水供应系统。坐上马桶,粪便一冲而走,这极大地改善了大众的生活。但令人想不到的是,马桶的普及也带来了灾难性的后果。在当时,即使像伦敦这样先进的城市,也没有一套与之相匹配的污水处理系统。大多数抽水马桶只是把污水和粪便排到了和房子邻近的粪坑当中,而这些粪坑需要掏粪工人来清理,粪便还需要用马车来运输。
这时的伦敦正处在快速的城市化进程当中,拥有240万人口,而它的面积却只有230平方千米。到粪坑来拉粪便的马,就是当时最主要的交通工具,这些马也会随地排泄。这样一来,一种可怕的烈性传染病——“霍乱”开始流行。当时,这种病无药可医,染上就是等死,而且症状十分恐怖:全身肌肉痉挛,不停地上吐下泻,直到身体内的水分被排干,十分痛苦。
当时主流的观点认为城市里的恶臭空气是霍乱的源头,即“瘴气论”,人们因此而紧闭门窗,每日祈祷,希望借此逃脱死神的收割,情况却并不见好转。直到斯诺(1813-1858)医生的出现,事情才发生扭转。他运用数据和统计为武器,和夺走数十万人性命的疾病展开了斗争。
早在1831年,霍乱头一次在伦敦暴发的时候,斯诺还是一名学徒,他目睹了整座城市的生活如何被摧毁,于是他开始关注并研究霍乱这种病。那么,斯诺究竟是如何用数据的力量战胜霍乱的呢?
1848年,伦敦暴发了第3次大霍乱。斯诺发现,霍乱患者的最初症状都是呕吐、腹泻。“如果真的是瘴气传播,那为什么最先被感染的不是鼻子和肺,而是肠胃?又为什么一家人当中会有幸存者,接触患者的医生也不会被传染?”
斯诺断定,细菌一定是经人的口腔进入肠胃的。他推测这极有可能是因为喝了不干净的水。但受限于当时的科学设备,看不到水里的微生物。被霍乱细菌污染的水,看起来和正常的水一样纯净透明。斯诺根本无法验证他的观点。
为了获得更多证据,斯诺深入病区,他挨家挨户地敲门,询问患者喝水的信息。他发现了一个惊人的事实,1848年至1849年霍乱暴发期间,伦敦市共有7466人死亡,其中4001人都居住在泰晤士河南岸。根据这些数据,可以看出南岸的死亡率是市中心的3倍,而伦敦西边和北边的死亡率很低。
对此,“瘴气论”的流行解释是,泰晤士河南岸聚居了大量的劳工阶层,污浊的空气导致了更高的死亡率。
斯诺举出反证说,伦敦东区比泰晤士河南岸聚居了更多的民工,是全伦敦最贫穷、最拥挤的地方,但死亡率却只有泰晤士河南岸的一半。真正原因是南岸居民的饮用水都来源于泰晤士河,而北岸居民的饮用水有多个来源,泰晤士河只是其中之一。他分析了各个来源,发现死亡的人数和饮用水的来源有高度的相关性。
1849年,斯诺把这些调查和发现编写成了一本小册子—《霍乱的传播方式》,正式提出了水污染是造成霍乱流行的真正原因。但他的观点无人相信,大众对“瘴气论”仍然深信不疑。毕竟,嗅觉是人类的一种最原始的感觉,人类对自己感觉的迷信可谓根深蒂固。
法尔对斯诺的观点也半信半疑,他提出:要测定水源对霍乱的影响,必须要有两组居民。这两组居民要生活在同一海拔高度,活动于同一空间,吃的东西要一样,工作内容也要相同,唯一不同的条件就是饮用水的来源。但现实中的伦敦显然找不到这样的实验条件。
不过,斯诺最终说服法尔,在他的统计当中增加了一个新的变量:死者的水源。水源这一变量的加入,也成了遏制霍乱流行的关键一环。
1854年的秋天,霍乱又一次席卷英国。8月31日暴发,3天后就有127人死亡;10天后,死亡人数攀升到500多,其中一个叫宽街的地方,死亡人数最多。
这时候的斯诺,每周总是在第一时间阅读法尔的死亡报表,关注死者的水源,希望在表格和数据中寻找到线索。虽然法尔收集了水源,但根据这部分数据,斯诺却做不出任何判断。
为什么呢?
这是因为整个伦敦有十几家大公司在为城市供水,各个公司的经营范围互相交错,供水管杂乱无章地交织在一起,仅凭地址无法准确判断供水公司。
斯诺左思右想,无计可施,最后用了最笨的方法:上门走访。但斯诺很快发现,即使挨家挨户去敲开患者的门,得到的结果还是不完整、不准确的。这是因为很多住户根本不知道自家的供水公司是哪一家,而有的住户家中的水费可能是由房东支付的,并且很少有人保存收据。
苦心人,天不负。细心的斯诺又发现了新的线索。他在走访中得知,某家公司的水所含盐分是另外一家公司的4倍,凭借这个差别就能判断水的来源。这样一来,他碰到不知道哪家公司给自己供水的住户,就取一小瓶水样,在瓶上注明地址,然后拿回去分析。
在死亡人数高度集中的宽街,他发现:几乎所有的死亡病例都发生在同一个街头的水泵附近,只有10名死者的住所靠近另一个街头的水泵。在这条街上,他还发现,有一家啤酒厂和感化院没有一个人死亡。他实地走访了这两个地方,发现啤酒厂和感化院都有自己的独立水井,而且啤酒厂的工人平常只喝啤酒,不喝水。斯诺更加确定,水就是人们感染霍乱的最终原因。
斯诺不仅追踪每一起因霍乱导致死亡的病例,他还创新了记录的方法,他将死者的地址在地图上标注成一个一个的点。当所有代表死亡的点都被标注上去之后,地图呈现的信息立刻清晰起来:霍乱绝不是像一团云雾一样逗留在该地区,而是从一个点辐射出去的,那就是水泵!斯诺用数据呈现了水源质量与病例之间的关系,图表的视觉冲击力一下子驱散了疑云!
9月8日这天晚上,是新一轮霍乱暴发的第十天。在政府组织的紧急会议上,斯诺展示了自己的数据和发现,并建议立即封闭宽街上的水井,以此切断霍乱的传播。
这在当时是一个异常艰难的决定。因为如果斯诺搞错了,那些备受瘟疫折磨的家庭还将没有水喝、没有水用,这无异于雪上加霜。但斯诺在会议上慷慨陈词,请大家相信他的数据和分析。如果他是对的,这个举措将会挽救无数的家庭和生命。市政理事会最后投票决定采纳斯诺的建议,立即拆除了宽街上的水井的水泵手柄,以控制水井的使用。
宽街的霍乱由此慢慢平息下来。
可惜斯诺在45岁时,因病去世。据说他的早逝跟年轻时做实验吸入了太多的麻醉气体有关。今天,斯诺被全世界尊称为“现代流行病学之父”。但在他离世之前,他对霍乱的发现和贡献并没有得到社会的广泛认可。据斯诺的一位朋友回忆,他对此已有预见,他谈到他的观点不被认可时如先知一般平静,他是这么说的:
很可能你和我都活不到那一天,等那一天到来的时候,也许没有人还记得我的名字,但是到了那时,霍乱的大规模暴发就成了往事,人们掌握了霍乱传播的方式,霍乱由此终结。
以上内容节选自——《给孩子讲大数据》。
《给孩子讲大数据》和《给孩子讲人工智能》是中国大数据倡始之人、百万级畅销书作者涂子沛,首次写给孩子的重磅力作。
大数据究竟是什么?它和我们熟知的数字、数学又有着什么样的联系?《给孩子讲大数据》回溯数的发展、数据在中外历史重大事件的全方位应用,为孩子打开大数据之门,培养孩子们的“数商”和数据思维。
人工智能正在撬动中国的创新,成为全领域、各行业关注的热点。《给孩子讲人工智能》用故事和案例对人工智能的“前世今生”进行全面解读和深度点评,堪称“人工智能的启蒙必读之选”。
风趣而充满可读性的漫画、让人赞不绝口的历史故事,带给孩子深入浅出、化高深于无形的广博知识,让孩子在前沿科技中泰然自若、乘风破浪,将这两本书作为了解大数据与人工智能的入门指南。
为了感谢大家的支持,鲜枣课堂联合童趣出版有限公司,通过本次活动送书10套!!!
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!