当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 尽管近几十年来在检测和治疗方面取得了稳步进展,癌症仍然是美国的第二大死亡原因,每年约有50万人因癌症去世。为了更好地认识和对抗癌症,医学研究者们开始借助癌症登记程序开展研究。这一全国性的组织网络

尽管近几十年来在检测和治疗方面取得了稳步进展,癌症仍然是美国的第二大死亡原因,每年约有50万人因癌症去世。为了更好地认识和对抗癌症,医学研究者们开始借助癌症登记程序开展研究。这一全国性的组织网络可系统收集与美国癌症诊断、治疗和发病史相关的人口统计数据和临床信息。监测工作由国家癌症研究所(NCI)和疾病控制预防中心共同协作完成,目标是使研究人员和临床医生能够监测全国、各州各地方的癌症病例。

这些数据大部分摘自电子文本临床报告。这些报告必须由人工整理,因此需要历时很久才能被用于研究。例如,一份详细描述癌性组织的癌症病理报告在被录入登记系统之前必须先由多位专家审核。随着每年数百万份新报告的不断产生,信息负担不断加重。

美国能源部(DOE)橡树岭国家实验室(ORNL)健康数据科学研究所主任Georgia Tourassi表示:“手动模型是不可扩展的。我们需要开发新的工具,使其能够自动完成信息提取过程,真正实现美国癌症监测的现代化。”

自2014年以来,Tourassi团队一直在专注于开发一款能快速识别癌症报告中有价值的信息的软件,这种能力不仅可以节省时间,还可能揭示癌症研究中被忽视的一些方法。在尝试使用传统的自然语言处理软件试验后,该团队利用深度学习技术获得了最新进展,深度学习是一种机器学习技术,能够利用算法、大数据图形处理器的计算能力来模拟人类的学习和智力。

借助于橡树岭计算机科学联合研究所(Oak Ridge Leadership Computing Facility)的超级计算机TItan,Tourassi团队应用深度学习技术从癌症病理报告中提取到了有用的信息。通过使用适当的数据集,该团队获得的初步成果证明了深度学习在癌症监测中的潜力。

自动数据工具的不断发展与成熟是美国“癌症登月计划”(Cancer Moonshot iniTIaTIve)的目标之一,将使医学研究人员和政策制定者对美国癌症人群的具体现状获得空前认识,而过去的病例数据仅仅来自不到癌症患者总人口5%的临床试验患者。

Tourassi说:“我们目前是根据很小比例的癌症患者的治疗效果做出判断,而他们不能代表整个患者群体。我们的工作显示了深度学习的潜力,它可以判断癌症治疗和诊断方法的有效性,并让癌症患者更好地了解这些方法的现实效果。

开发一款不仅能够理解词义还能理解词语之间上下文关系的软件并非易事,人类需要通过多年的训练来发展这些技能。对于特定任务,深度学习技术能够将该过程压缩到几个小时。

通常可通过训练神经网络来实现语境创建。该神经网络是一个加权计算网络,能就如何正确执行任务提出明智的建议,如识别图像或处理语言命令,输入到神经网络的数据和选择性反馈信息为软件提供了决策依据。程序员很难弄清这一算法决策过程。Tourassi称,有了深度学习技术,用户只需要把文件内容导入,然后就能得到结果。它更像一个黑盒子,但这正是其吸引人之处。

图形处理器可通过同时快速执行多个深度学习计算进程来加速软件的学习过程。在最近两项研究中,Tourassi团队使用了加速器调整多个算法,并将结果与传统方法进行比较。通过使用国家癌症研究所的SEER项目提供的1976份病理学报告组成的数据集,Tourassi团队训练了一种深度学习算法,用来执行两种密切相关的信息提取任务。在第一项任务中,算法通过扫描每份报告的内容确定肿瘤的首发部位。在第二项任务中,算法识别的是肿瘤部位的偏侧性或肿瘤位于身体的哪一侧。

该团队建立了一个能够发现上述两项任务间共同点的神经网络,并称之为多任务学习,他们发现该算法的表现明显优于其他方法。Tourassi说:“这样的发现是有意义的,因为了解相关任务的相互关系的目的正是为了执行更难的任务。人类可以胜任这种类型的学习,因为我们理解词语之间的语境关系,这正是我们试图通过深度学习实现的目标。”

Tourassi团队开展的另一项研究使用了946份关于乳腺癌和肺癌的SEER报告应对更复杂的挑战:使用深度学习将癌症的来源与相应的拓扑代码进行匹配。该分类比癌症的首发位置或偏侧性更具特异性,有12种可能的答案。

为了解决上述问题,该团队建立了一个卷积神经网络并使用各种语料训练。输入的文本包括一般领域(如Google搜索的结果)、特定领域(如医学文献)和高度专业化领域的资料(如癌症病理报告),然后算法基于这些输入信息创建一个数学模型,用以描绘单词之间的联系,其中包括不相关的文本之间共有的词汇。

通过将这种方法与传统的分类器(如矢量空间模型)进行比较,研究小组发现,随着网络中纳入了更多与癌症相关的文本,算法性能变得越来越好。这些初步结果将有助于Tourassi团队进一步扩展深度学习算法,从而能够处理更大的数据集并减少人为干预。

2016年,美国能源部将Tourassi团队的癌症监测项目列入了“百亿亿次级计算项目”,该团队在利用深度学习进行癌症研究方面已经取得了巨大进展,希望在未来能够取得更多的研究成果。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭