医疗AI不断进步,如何监管成难题
扫描二维码
随时随地手机看文章
在医疗人工智能产业发展地如火如荼之际,人们开始对这个新兴事物进行思考:我们到底该怎么用,用了之后又要怎样管。
健康点了解到,实际上,自从2017年7月20日国务院发布《新一代人工智能发展规划》,中国药品生物制品检定所、国家药品监督管理局(CNDA)等相关机构都在积极与行业人士接触,相关政策、监管方案都在紧锣密鼓的制定当中。不过,目前尚未通过相关政策。
而作为目前最为聚焦的医疗影像 AI ,政策与监管方案更是影响其商业化落地速度的重要因素。
近日,在飞利浦主办的在医疗人工智能尖峰论坛上,中华医学会放射学分会候任主委、上海长征医院影像科主任刘士远教授强调,目前医疗影像 AI已经进入了发展的关键阶段,但是医疗影像 AI 能解决什么问题,产品应该聚焦在什么领域,产品如何解决临床实际问题等一系列问题都在等待解决。而其中的重中之重就是做好标准,完善相关政策。
政策缺位最直接的结果就是相关产品无法过审。刘士远提到,目前已经有九项医学人工智能产品向国家药品监督管理局(CNDA)进行申报三类器械,但没有一个被批准,用什么样的标准和规范也仍在讨论当中。
难在美国:缺人缺钱缺标准今年4月初,美国FDA批准通过了IDx公司研发的首个应用于一线医疗的自主式人工智能诊断设备——IDx-DR 的软件程序。它可以在无专业医生参与的情况下,通过查看视网膜照片对糖尿病性视网膜病变进行诊断。
5月24日,FDA又批准了一种名为OsteoDetect的新型人工智能工具,该工具是一种计算机辅助检测和诊断软件应用程序,它使用AI算法来帮助医生以比传统诊断技术更快的速度确定腕骨骨折。值得一提的是,这是今年FDA批准的第三个独立进行诊断的人工智能工具。
△FDA上月末批准了第三个医疗AI产品,用来检测腕部骨折的OsteoDetect
消息传来便引起中国相关行业人士的热议。以IDX为例,作为一家专注于开发临床自主诊断算法的公司,IDx单就和 FDA 在如何评估系统并确保其准确性和安全性方面就花了7年的时间去沟通。而在中国,绝大多数企业仍处于初创期,对于未来需要等待多少个7年,市场上的“玩家”大多心存忐忑。
为什么 FDA 可以率先完成医疗 AI 产品的审批呢?从FDA 的角度来讲,医疗影像 AI 可以分为两种,一是用于检测身体不正常状况的产品,二是用于评估疾病是否存在以及严重性、分类等的产品。前者属于二类器械,后者则是风险级别更高的三类器械。目前,FDA 通过的医疗影像 AI 产品大多定性为二类设备,在对这类设备的审批方面,FDA已经积累了很多经验,可以提供相应的审批标准。
不过即使这样,关于AI产品标准的争论和担忧在美国也一点不少。FDA局长Scott Gottlieb在最近的一次演讲中承认,人工智能领域的创新速度比该机构预期的要快得多,不过他承诺,FDA正在迅速处理未解决的监管问题。
业内对FDA的质疑其实很多。首个质疑就是FDA在批准人工智能产品的时候政策缺乏确定性。许多法律界和人工智能研发人士认为,与传统的药械审查不同,FDA如何定义对AI医疗产品的“独立审查”(independently review)一词并不清楚,在审查不同人工智能产品时的标准界限也不一致,FDA尚未发布最终指南来厘清相关问题。
其次就是对医疗AI产品的监管与FDA传统的工作路径完全不同。人工智能机器学习的特征就决定了,一项产品在诞生的时候并不完美,而是在后天的不断应用中不断完善自己。这就要求研发者在开发和测试过程中不断调整优化其性能。为此,FDA创新性地制定了一种新颖的监管方法:预认证计划(pre-cerTIficaTIon program),这一监管思路不是专注于个别产品,而是应用其“预认证计划”来审查开发它们公司的基本资质。FDA将允许开发公司后续对申报AI医疗产品不断进行微调,而无需再向FDA提交新的审查内容。但是有行业人士就认为,使用预先认证来审核AI产品将与FDA的历史审查监管方法出现“重大背离”。
再者就是从哪儿招聘能够对企业申报的AI医疗产品进行审查的人才?本身市面上这类人才就极为稀缺,FDA面对的是大型科技公司高薪的竞争。美国媒体披露,对人工智能工程师,大型科技公司平均的薪酬超过30万美元,相比之下,作为政府部门,FDA最近发布的数字健康工程师的招聘信息显示,相关岗位的薪酬只有95,000美元至123,000美元。这显然不足以吸引到顶尖的懂医疗AI的人才。
难在中国:认证的是三类器械而对于中国企业来说,CNDA 的审批更加严格。根据2017年发布的最新版《医疗器械分类目录》显示,若诊断软件通过其算法,提供诊断建议,仅具有辅助诊断功能,不直接给出诊断结论,本子目录中相关产品按照第二类医疗械器管理。若诊断软件通过其算法(例如,CAD,骨密度外)对病变部位进行自动识别,并提供明确的诊断提示,则其风险级别相对较高,本子目录中相关产品按照第三类毅力考器械管理。如此看来,市场上大部分的医疗AI产品都属于三类。
目前,中国有部分企业已经率先申请了二类证。但如汇医慧影、Airdoc、依图医疗、推想科技等申报三类器械的产品都尚未得到认证。
“药品和器械在国家的监管层面有很详细的规定,但是医疗人工智能产品是新产品,详细的标准还在制定中。”位列国家首批新一代人工智能平台之一的腾讯觅影团队也参与了相关标准的制定工作。腾讯公司优图实验室医疗 AI 总监郑冶枫介绍到,“十三五规划中关于医疗 AI 方面腾讯是有所参与的,另外国家糖网检测的人工智能应用腾讯也有所参与。”
对于标准具体规定的是什么,腾讯互联网+生态合作总经理古佳告诉健康点,人工智能产品是软件,需要不断的更新迭代,没办法固化下来。而国家希望通过认证的版本可以达到一个既定的目标。比如,产品的检出率是多少,假阴性和假阳性的比例是多少。而软件每一次迭代更新都可以根据这个标准来破判定是否可以通过认证。
标准数据库建设先行“我们参观过一些医疗人工智能的公司,他们有的说自己已经完成了几万例筛查,但是却不知道其中有多少是手术证实的、有多少是毛玻璃结节、有多少是炎症、有多少是转移瘤、有哪些是原发性结节。这种检测并不能作为诊断结果使用。”近日,在北京医院、GE医疗、腾讯三方共同发起“医学磁共振影像人工智能联盟”发布会上,全军放射医学专业委员会首席专家张挽时直指问题所在。他提出,在标准尚未形成的情况下,医疗人工智能还有很长的路要走。
对此,全国政协委员、中华医学会放射学分会副主任委员陈敏也提到,目前人工智能在医疗领域应用最多的就是肺结节筛查,而结节如何定性、如何制定检出率都还没有明确下来。“所以大家现在要把数据和经验都积累起来,做成标准,在技术层面形成类似于大脑的医生诊断平台。”
就目前行业在相关标准制定的进程上来讲,按病种进行的标准测试数据库建设已经开始。其中,今年三月,据中检院官方微信发布的信息显示,眼底部分的标准测试数据集已经建设完成,且肺结节的标准数据库建设方案也已经定稿。
如何才能让这个标准测试数据库被大多数企业和机构认可,又如何才能保证数据库的公平性?据了解,该数据库中的肺结节图像数据采集将不少于5家医院,每家企业2000张。而采集图像的设备需要统一为GE、西门子等大厂商符合DICOM3.0协议标准图像,且必须取得伦理委员会许可才能使用。此外,参与标准测试数据库建设的刘士远介绍,数据库在建设过程中会遵循三大主要原则。一是广泛性,数据要来自全国各地不同的医院。二是兼容性,比如肺部图像就要有不同层厚的CT图像。三是标记标准化,要为数据打上标准的标签。
在建立标准数据库的同时,不少企业也在献策献力。作为北京医院方面的代表,陈敏提到,医学磁共振影像人工智能联盟的成立也是对标准制定的贡献,是一个起步,可以为解决数据标准化的问题提供一个解决方案。
据健康点了解,“医学磁共振影像人工智能联盟”以北京医院放射科专家、临床专家团队为中心,利用GE高端磁共振技术平台以及MAGiC等应用,借助腾讯觅影的人工智能与深度学习技术平台,以多中心研究项目的方式,联动各地医院,开展医学影像与人工智能研究项目。该联盟旨在提升重大疾病的早期发现、疾病诊断精准度以及临床工作效率,使磁共振影像AI分析成为疾病研究、精准诊断的重要依据。同时也将推动磁共振影像技术标准化和普及化。
除医学磁共振影像人工智能联盟外,今年4月,中国医学影像AI产学研用创新联盟也正式成立,刘士远所在的上海长征医院成为联盟的理事长单位。成立之初,联盟提出其最迫在眉睫的任务就是研究制定医疗人工智能领域相关的政策、行业规范、技术和产品标准、机制,推动全国范围内同质化的进程。