AI医疗影像商业化应以标准先行数据为重
扫描二维码
随时随地手机看文章
对于中国这样一个人口大国来说,医学影像的市场潜力可谓十分巨大。据统计,截至目前中国医学影像的检查总数已经超过了75亿,而且随着设备越来越复杂、信息量越来越大,以及图像从二维走向三维、静态迈向动态,数据量每年也在呈现飞速增长的态势。不过,从中美两国的医学影像数据年增长率来看,中国以30%的增长率落后于美国的63%,而放射科的专业人才年增长率更少,目前为止整个中国的影像科和病理科人才加在一起也仅8万左右。这种海量图像数据带来的挑战,加之专业医疗人才的稀缺,使得本土AI医疗影像检查/筛查的需求日益迫切。
AI究竟能何种程度上提升检查/筛查效率?典型比如我们做的X射线胸片的筛选,从大概12万的病例做检查,覆盖了肺部常见的9种疾病,其中挑选了4种典型的疾病,相当于是胸片的预筛。我们可以通过AI的方法把彻底没有病的这部分快速筛出来,将健康的部分筛出去,可以大大降低医生的负担,从不同的疾病把医生的工作量从76%降低到35.9%,同时它的漏诊率也达到了一个相当低的水平。
而从实际应用来看,放射治疗的前期一般都要做相应的靶区规划以及靶区的分割,就是将靶区给勾画出来。如果按照传统的办法,十分费时费力,但采用深度学习的方法,我们就可以将分割时间缩短到传统分割方法的5%,同时分割的成功率从90.1%提高到97.8%,这是目前我们对外售卖的产品上已经能够达到的实际效果。
尽管“AI+”的效果如此明显,但缺乏统一标准的应用再好也难成大器,这也成为困顿本土AI医疗影像技术迈出市场化关键一步的最大障碍。尤其是对医疗这一特殊而复杂的行业来说,不同病人的病理指征通常不同,而且可能针对同一种疾病,各医生给出的意见也各有差别。这种变幻莫测的复杂状况,也极大提升了当前医疗影像技术与AI结合的难度。
标准之后,要深入解决AI医疗影像技术的落地难题,还需要更多的去挖掘高质量的基础数据。纵然,中国借助于如此庞大的人口优势,多年来已经获得了海量的医学影像数据,但实际上这些基础数据中真正能够为AI所高效利用的部分并不多,大样本和高质量的数据获取依然是本土AI医疗影像技术的缺憾,这会造成诊断精确度低、投入高回报差甚至信任缺失等严重问题。也正是因为这些精准高质量数据难以获得,吸引了一大波AI创业公司蜂拥而入医疗影像市场淘金。
事实上,普通的医疗影像数据可以说遍地都是,但医学上很多疾病数据实际上是很少的。某业内资深人士表示,“一家医疗单位可能仅有一两百病例符合标准,甚至可以说没有一家医院敢说自己拥有几千例这样的符合标准的图像数据。
可能一家医院有数万病例,但基于不同的疾病、检查方式、研究目的区分之后,数据一下子就会变得很少。医疗数据不像购物那么简单,医疗数据很多是不确定的,很难打通,这种情况下,具备完整信息的病人资料就尤其宝贵。拿肺癌或其他肿瘤来说,在大医院,满足要求的可能只有10%-20%,这已经算不错的;在二甲等地方医院,很多病人做了检查之后,就去上级医院看病去了,有完整资料的病人可能只有1%-2%。”
正是因为缺乏有效数据的训练,使得如今的医疗机构利用AI来做医疗影像筛查颇具成本压力。向军表示:“现在,能看的病不多是AI面临的一个很大的问题。比如一个放射科医生能看100种病,可能AI现在在其中7种、8种病上已经比医生看得更出色,但是还有剩下的92、93种病它其实是无能为力的。所以,真正要达到解决问题,彻底降低医生的负担,减少对医生的数量需求,应该说现在还远远没有到这个时候。”
这也就会出现医疗机构还得专门雇一个专业医生,并摊付额外的成本的现状。此时,究竟AI对于医疗机构到底是负担还是帮衬,值得商榷,向军进一步补充到:“所以现在很多AI医疗影像设备放在医院其实是吃亏的,如何将其变成一个刚需是需要考虑的问题。如果全中国的‘AI+医疗公司’能够形成联盟,大家可以相互分工,各有所长,而不是都做同一件事情,最后形成某种意义上技术共享,达成一个真正意义上的医院不需要再雇佣DR医生的水平,这就变成刚需了。”
这种有效数据的缺乏可以通过做大量数据标注的工作来解决。很多医疗图像数据并不是简单的零或者一,而是需要做经验的判断,通过有效标注,很多看似无用的数据几乎也都能够变成有效数据,但是,数据标注还是现阶段一个比较大的问题,因为AI做算法的第一要求就是数据标注的得是完全正确的,所以现在各种方式,包括算法如何去解决标错的问题,以及标注本身,业内都有在进行讨论和规划。在标注问题上,我们也开了各种各样的讨论会,医生之间的观点比较一致,但医生在数据标注完之后可能还会有三盲五盲的问题,后期我们也还需要再把相对一致性的东西挑出来,以及继续深入去讨论和解决。