专访联想AI实验室负责人徐飞玉:深度学习的黑盒为何重要
扫描二维码
随时随地手机看文章
当深度学习的“魔力”在人工智能研究领域大放异彩之时,许多相关领域的研究者痴迷于深度学习所带来的惊人的模型效果,却往往忽略,或是刻意回避了这样一个现实:经过深度学习模型得出的结果,无法用目前所掌握的知识和逻辑去解释。深度学习的模型,就像“黑盒”一般呈现在人们面前,但依然吸引着无数的研究人员趋之若鹜。
在联想人工智能实验室负责人徐飞玉看来,可解释性的AI(人工智能)是重要的,研究人员不应该单纯追求模型的精确预测结果,而忽略了模型的可解释性,在25日举办的人工智能峰会上,徐飞玉分享了她以及她所带领的联想人工智能实验室,在可解释性AI方面所取得的研究成果,在随后接受腾讯新闻《一线》等媒体的专访中,徐飞玉进一步介绍了她所带领的联想人工智能实验室在成立两年来所取得的进展以及未来的重点发展方向。
徐飞玉认为,可解释性AI 对研究人员提出了更大的挑战,不应该只满足于模型结果,应该进一步挖掘背后的机理,同时可解释AI对于决策者来说也更加能够接受,并应用到具体的生产经营环节中。
成立于两年前的联想人工智能实验室,目标定位是做一家世界级的AI研究所,作为领头人,她并不满足于仅仅将AI应用纳入到联想自身的生产经营体系中,更大的目标是能够将实验室的人工智能研究能力开放出去,赋能更多的企业和用户,最终推动社会福祉向前。
可解释性AI为何重要
“作为科学家,实际上我对于深度学习、黑盒子是不满足的。”在回答腾讯新闻《一线》的提问时,徐飞玉说,“如果科学家只会解决很简单的问题,那就不是科学家了。”
在当天的演讲中,徐飞玉表示,目前的深度神经网络对人类来说还是一个“黑盒子”,导致人类不敢用、不能用,阻碍了人工智能的落地和商业化。因此,可解释性对机器学习,特别是深度学习是一个很大的挑战。
“只有人类理解了AI的决策过程,才能将其应用在更广泛的社会场景中。”徐飞玉说。
在接下来的专访环节,徐飞玉进一步解释了她所理解的解释性AI为何重要。以联想自己为例,人工智能实验室会于业务集团进行合作,当通过深度学习模型预测出,某个生产基地的某个部件的供应量需要提高1%或降低1%,在与供应链管理的具体决策者提出时,便需要能够解释,为何要提高或降低这1%,这一关键决策会直接影响到最终的生产、销售环节,如果最后终端用户需求达不到满足,相应的负责人就需要承担责任。
只有当预测出结果的模型能够被清晰地解释时,才能够真正被相关决策者所接受,并最终实现模型最初所期望达到的目标。
另外在医疗领域,越来越多的人工智能技术开始运用到医疗诊断过程中,如果无法向医生解释诊断结果,也会影响这一技术最终的应用。
“和人的生命健康有关系的那个黑盒子有可能不是一个大众能够接受的状态。”徐飞玉说,她认为,在可解释性方面,首先需要把“黑盒子”打开,其次是让“黑盒子”里面的神经产生语义,知道里面说的是什么意思,第三个是生成一些解释给医生。
联想从事人工智能研究的独特定位与优势
人工智能的重要性不言而喻,在某种程度上,掌握了人工智能,便掌握了未来科技行业发展的制高点,联想在2017年3月成立了人工智能实验室,目的也是为了在这一领域占的先机。徐飞玉作为该实验室的负责人,对于实验室的定位和发展方向有着明确的把握,在专访过程中,徐飞玉介绍,目前该实验室覆盖的研究领域包括自然语言处理(NLP)、语音识别、计算机视觉、机器学习及智慧数据、AI训练平台及AI开放创新平台。
在这些研究领域的基础上,联想目前已经形成了人工智能的创新生态,即通过学术合作,将技能、专业知识和技术传导至人工智能实验室,充分利用联想设备获取的大数据进行相关研究并部署到联想云上,并向商业合作伙伴提供智能设备、智能云和智能服务等,同时,与合作伙伴合作所获得的大数据,又能反哺联想人工智能的研究,形成正向良性循环。
在业界各大公司纷纷设立自己的人工智能实验室的趋势下,联想的人工智能实验室却展现出了其独特性,在回答腾讯新闻《一线》的提问时,徐飞玉表示,对于联想这样一个在个人电脑领域全球第一的公司,AI Lab设立的目标定位从一开始就是三个“Pro”,即“Product”(产品、服务)、“Process”(流程)和“Promotion”(宣传)。
首先从产品端来看,联想的人工智能技术有语音技术、自然语言分析技术、计算机视觉技术,这些技术可以让联想的设备、PC和手机在人机交互方面做得更好。这运用到了两个非常重要的技术,即:多媒体和多模型交互。从软件和硬件解决方案两方面,人工智能对于像联想这样的公司非常重要。
其次对于业务流程,联想最显著的一个例子是,运用机器学习或者是可解释的人工智能技术,帮助各层级的供应链管理做得更好。
“联想是一个典型的IT制造型公司,如果我们的process做得很好,可以为公司省很多成本。”徐飞玉说。
她表示,在供应链方面,一般公司50%到70%的资金流都有可能被供应链占据。这部分的优化,能够使得成本和效率得到显著提升。
第三在宣传方面,徐飞玉表示,联想的“promotion”部分也很智能。不管是谷歌、阿里、百度、IBM,还是AlphaGo或者是IBM沃森,都有很好的promotion手段。
“我一直对联想AI Lab团队有一个要求:虽然我们的团队很年轻,但是一定要把成为世界级AI实验室作为我们的目标。”徐飞玉说。
她认为,尽管现在做人工智能的技术门槛比以前要简单很多,因为有很多开源技术,但联想AI Lab的定位是做一个世界级的AI实验室,参加国际竞争。
“我对团队平常工作的要求也很高。直接的结果就是给公司一个很好的Promotion。所以联想AI Lab和其他公司不一样的是,联想AI Lab的目标是把联想的产品做得更加智能,并创造新的智能产品,第二个是帮助公司实现智能化变革,第三是让整个联想文化变成data driven smart(数据驱动智能)的文化。”徐飞玉说。
从事人工智能研究须将社会福祉考虑进来
在信息时代,数据隐私已经成为一个绕不开的话题,对于人工智能研究而言,掌握大量的数据是进行研究的前提和基础,如何平衡好数据隐私保护与研究的关系,徐飞玉在专访中强调,作为科学家乃至整个公司,在进行人工智能研究时,必须促进人类社会福祉这一重要因素考虑进来。
“研发人员不是在一个真空的世界里做研发,应该知道我们生活在一个什么样的环境中,”徐飞玉说,“不管是个人,还是安全,还是可解释的人工智能,都必须成为我们研发人员应该有的意识。“
在获取数据方面,徐飞玉认为,如果是为了让研发项目做得更快,当然是数据越多越好、数据孤岛越少越好,但是另一方面,需要考虑到监管和法律框架的影响。
但同时,许多领域由于法律制度还不健全,实际上阻碍了人工智能的应用对于该领域的贡献,例如在医疗领域,其实很多数据根本没有打通,一个医院里面可能部门和部门之间的数据都没有打通。
“但是,如果要做罕见病的研究,有可能中国有100例,德国有20例,美国有10例,这个时候为了人类的发展、人类的进步、医疗的进步,这些数据应该是被打通的,且必须打通,我觉得任何最终的发展都要为人类服务。”徐飞玉说。
她提到另一个例子是肝病的相关数据,中国是世界肝病第一大国,肝病是全世界第三大的肿瘤,中国有如此多的数据,通过中国人和专家的经验知识,完全可以赋能国际医疗研究。
徐飞玉认为,在这部分可能不只是一个企业,还需要一个国家或者是整个学术的合作才能建立起来。
“我很高兴地看到中国在率先做这个事情,即国家级的开放创新平台,这个平台也是全世界最先进的平台。联想也愿意贡献开放创新平台生态和算法模型,赋能整个社会和全世界。”徐飞玉说。