吴恩达团队展示全新医疗影像识别技术:肺炎诊断准确率超过人类医生
扫描二维码
随时随地手机看文章
摘要:选自StanfordMLGroup作者:PranavRajpurkar等机器之心编译参与:李泽南机器学习在医疗领域的应用一直是AI的重要发展方向,深度学习著名学者吴恩达和他在斯坦福大学的团队一直在这一
选自Stanford ML Group
作者:Pranav Rajpurkar等
机器之心编译
参与:李泽南
机器学习在医疗领域的应用一直是 AI 的重要发展方向,深度学习著名学者吴恩达和他在斯坦福大学的团队一直在这一方面做着努力。近日,该团队提交的一篇新论文提出了名为 CheXNet 的新技术。研究人员在论文中表示:新的技术已经在识别胸透照片中肺炎等疾病上的准确率上超越了人类专业医师。吴恩达表示,或许放射科医生们需要开始担心他们的工作了。
仅在美国,每年就有超过 100 万成年人因为肺炎住院,5 万人因为该病而死亡(CDC, 2017)。目前,胸部 X 光检查是诊断肺炎的最佳方法(WHO, 2001),这种方法在临床护理和流行病学研究中发挥着重要作用。然而,通过 X 光片诊断肺炎是一个具有挑战性的任务,需要放射科医师专家级的判断能力。在斯坦福大学发表的新论文中,计算机科学院和医学院的研究人员共同提出了一种新的机器学习模型,可以让计算机通过胸透照片自动诊断肺炎,其诊断准确率超过了放射科医师。
图 1. ChexNet 是一个 121 层的卷积神经网络,以胸透图片为输入,输出患病概率。在这个例子中,CheXnet 准确地探测到了肺炎,同时定位了图片中最有可能患病的位置。
CheXNet 可以输出肺炎存在可能性的热区图。研究人员在最近发布的 ChestX-ray14 数据集(Wang et al., 2017)上训练了 CheXNet。该数据集包含 112,120 张各自标注最多有 14 种不同胸部疾病(包括肺炎)的正面胸透图像。研究人员使用密集连接(Huang et al., 2016)与批归一化(Ioffe & Szegedy, 2015)来优化这一深度神经网络。
图 2. CheXNet 在使用胸透图像识别肺炎任务上的表现要超过放射科医师的平均水平。在测试中,CheXNet 与四名人类放射科医师在敏感度(衡量正确识别阳性的能力)以及特异性(衡量正确识别阴性的能力)上进行比较。放射科医生的个人表现以橙色点标记,平均值以绿色点标记。CheXNet 输出从胸透照片上检测出的患肺炎概率,蓝色曲线是分类阈值形成的。所有医师的敏感度-特异性点均低于蓝色曲线,这意味着 CheXNet 在肺炎上的诊断水平与放射科医师相同,甚至更高。
从胸部 X 光检查照片中检测肺炎对于放射科医师而言是一个困难的任务。因为肺炎在照片上的表现经常难以识别——它可能会与其他病症重叠,也可以与其他很多良性异常类似。这些原因导致放射科医师在诊断肺炎时表现差异很大(Neuman et al., 2012;Davies et al., 1996;Hopstaken et al., 2004)。为了评估放射科医师的表现,斯坦福大学的研究人员找来了四名专业放射科医师,使用 ChestX-ray14 子集的 420 张图片对他们进行了测试。在这 420 张图片里,诊断正确与否的标准为其他大多数放射科医生的投票结果,与此同时,CheXNet 模型也以同样的标准进行了测试。
研究人员发现,CheXNet 在敏感度与特异性两个方面均超过了放射科医师的平均水平。为了对比 CheXNet 与此前使用 ChestX-ray14 的模型的能力,研究人员横向对比了新模型与其他模型在 ChestX-ray14 上对于十四种疾病的诊断准确率,结果发现新模型的表现在所有方面均超过了前人的结果。以超过专业放射科医师的水平自动对胸透照片进行分析诊断疾病不仅在临床上可以为我们带来更多方便,也可以在医疗影像专业人士数量不足的情况下为病人带来帮助。
表 1. CheXNet 在 ChestX-ray14 数据集中 14 种病变的检测结果与另外两种模型的对比。在检测肿块、结节、肺炎、气胸和肺气肿时,CheXNet 的表现超越了此前业内最佳水平至少 0.05。
图 3. 使用 Class Activation Maps,ChexNet 定位了它识别出的病变,高亮区域是分析病症需要重点观察的位置。
论文:CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
摘要: 我们开发了一种全新算法,能够从胸透照片里检测肺炎,且水平超越专业放射科医生。我们的算法被称为 CheXNet,它是一个 121 层的卷积神经网络。该网络在目前最大的开放式胸透照片数据集「ChestX-ray14」上进行训练。ChestX-ray14 数据集包含 14 种疾病的 10 万张前视图 X-ray 图像。在实验中,4 名专业的放射科学者在测试数据集上进行手动注释,并与 CheXNet 的表现进行对比。我们发现,在肺炎检测的敏感性与特异性上,CheXNet 的准确率超越了普通的放射科医生。我们把 CheXNet 应用到对 ChestX-ray14 数据集中 14 种疾病的检测上,也取得了顶尖的结果。