深度学习能使细胞和基因图像变得怎样
扫描二维码
随时随地手机看文章
卷积神经网络的深度学习使计算机更加有效、全面的处理图像,生物学领域正在逐渐运用这一技术,它能使细胞、基因等图像更加清晰,使机器看到更多人类从未见过的东西。
眼睛被认为是心灵的窗口——而谷歌的研究人员把它看作是一个人的健康指示器。这家科技巨头正在通过分析人视网膜照片,利用深度学习来预测人的血压、年龄和吸烟状况。谷歌(Google)的计算机从血管的排列中收集线索——一项初步研究表明,这些机器可以利用这些信息来预测一个人是否有心脏病发作的危险。
这项研究依赖于一种卷积神经网络,这是一种深层学习算法,它正在改变生物学家分析图像的方式。科学家们正在使用这种方法来发现基因组中的突变,并预测单细胞排列的变化。谷歌的方法已于2017年8月公布(R.Poplin等人,预印于https://arxiv.org/abs/1708.09843;2017),这是一系列新的深度学习应用程序的一部分,这些应用程序使图像处理变得更容易、更通用,甚至可以识别被忽视的生物现象。
“以前,将机器学习应用于生物学的许多领域是不现实的,”谷歌公司一工程主管菲利普·纳尔逊(Philip Nelson)说,“但现在可以了——而更令人兴奋的是,机器现在可以看到人类以前可能从未见过的东西。”
卷积神经网络使计算机能够高效、整体地处理图像,而不必将图像分割成多个部分。这种方法于2012年左右开始在科技行业流行起来,这得益于计算机能力和存储技术的进步;例如,Facebook利用这种深度学习来识别照片中的人脸。但是科学家们一直在努力将这些网络应用到生物学中,部分原因在于不同领域之间的文化差异。“找一群聪明的生物学家,把他们放在一个由聪明的计算机科学家组成的房间里,他们会互相讲两种不同的语言,并且有不同的思维模式。”加州旧金山一家由谷歌母公司Alphabet支持的生物技术公司Calico的首席计算官达芙妮·科勒(Daphne Koller)说。
科学家还必须确定哪些类型的研究可以通过网络进行,这些网络必须经过大量的图像训练才能开始预测。当Google想利用深度学习来发现基因组中的变异时,它的科学家必须将DNA字母串转换成计算机能够识别的图像。然后他们在DNA片段上训练他们的网络,这些片段与一个参考基因组一致,并且其突变是已知的。最终的结果是2017年12月发布的、可以在DNA序列中找到微小的变化的工具DeepVariant。在测试中,DeepVariant至少和常规工具一样好。
位于华盛顿西雅图的艾伦细胞科学研究所(Allen Institute for Cell Science)的细胞生物学家,正在利用卷积神经网络把用光学显微镜拍摄的细胞的平面灰色图像转换成3D图像,3D图像中一些细胞的细胞器都用彩色标记。该方法消除了对细胞着色的需要——细胞着色这个过程需要更多的时间和复杂的实验室,且可能会损坏细胞。上个月,该小组公布了一项先进技术的细节,该技术可以使用一些数据(比如细胞的轮廓)来预测更多细胞的形状和位置。
麻省理工学院和哈佛大学的影像平台主任Anne Carpenter说:“你现在看到的是,机器学习能完成与成像有关的生物学任务,这是一个前所未有的转变。”在2015年,她的跨学科团队开始使用卷积神经网络来处理细胞图像;Carpenter说,现在她的中心利用卷积神经网络方法处理的图像数据约有15%。她预测,几年后,该方法将成为该中心的主要处理方式。
其他人对这想法最为兴奋:使用卷积神经网络来分析图像可能会在不经意间暴露出微妙的生物现象,这促使生物学家提出他们可能从未考虑过的问题。尼尔森说,“科学上最有趣的短语不是‘我发现了!’,而是‘这太奇怪了——发生了什么事?’”
艾伦研究所的执行主任里克·霍维茨(Rick Horwitz)说,这种偶然的发现可能有助于促进疾病研究。如果深度学习能够揭示单个细胞中癌症的细微标志物,将有助于提高研究者对肿瘤恶化的分类。这反过来又会引发关于癌症如何扩散的新假设。
其他机器学习的生物学行家已经把目光投向了新的前沿,现在,卷积神经网络正快速向图像处理领域发展。德国环境健康研究中心(German Research Center for Environmental Health in Neuherberg)的计算生物学家亚历克斯·沃尔夫(Alex Wolf)说,“成像很重要,但化学和分子数据也很重要”。沃尔夫希望调整神经网络,以便分析基因表达。“我认为在未来几年将会有非常大的突破,”他说,“这使得生物学家能够更广泛地应用神经网络。”