苹果与小i机器人的AI语音的版权之争,虚拟机器人即将崛起?
扫描二维码
随时随地手机看文章
Bots的广泛使用,可以看成是AI深入发展背景下各种应用软件的一次智能化升级。虚拟机器人将在我们身边无时不在,无处不在。
2016年4月,上海第一中级人民法院的一纸裁定,似乎让一桩历时四年,复杂而曲折的知识产权官司画上句号。官司的一方,是大名鼎鼎的苹果公司,而另一方也非等闲之辈,是中国本土著名智能机器企业小i机器人。
官司于2012年6月开打。之前的2011年12月,苹果公司在iPhone4S手机上首次推出Siri,轰动世界。小i机器人认为,自己才是聊天机器人的先行者,其自然语言理解和聊天功能,不但拥有完全知识产权,而且在2004年就提出申请,2009年获得中国发明专利。而Siri的原专利权人2007年才出现,2010年被苹果收购;最初只不过是文字聊天,后来才实现了语音功能。所以,苹果的Siri是后来者,在中国销售侵犯了小i机器人的专利。
这场著名的知识产权官司可以说是一波三折。Siri被起诉后,苹果公司迅速展开反击。2012年11月,苹果向国家知识产权局专利复审委员会提出申请,请求宣告小i机器人专利权无效。国家知识产权局专利复审委员会罕见地组建五人合议组,最终认定苹果公司请求理由不成立,小i专利合法有效。随后,苹果公司索性将专利复审委员会诉至北京市一中院,北京一中院同样予以重视,组建处理重大案件的五人合议庭进行审理,判决驳回苹果公司的诉讼请求。经历了二轮败诉后,苹果公司却在北京市高院意外反转获胜。北京高院于2015年4月作出判决,以专利撰写中个别技术描述不充分为由,撤销北京一中院的判决,同时,撤销了专利复审委员会的认定。又经过一番司法程序,直到2016年4月上海一中院的裁定才使官司告一段落,小i机器人的起诉被驳回。
当人们普遍认为尘埃落定时,剧情再次峰回路转——最高人民法院2016年12月发出行政裁定书,中止北京高院的判决,由最高人民法院提审此案。这场官司,看来远未结束。
无论最后结果如何,小i机器人都不是输家,中国虚拟机器人Bots的实力在官司中充分显露出来。人们蓦然发现,Bots在中国起步如此之早,已在各行各业中大显身手。
虚拟机器人简史
Bots是Bot的复数形式,Bot是Robot(机器人)的简称,一般指无形的虚拟机器人、软件机器人。Bot也可以看作是自动完成某项任务的智能软件。随着AI应用的深入,智能软件或软件机器人Bots,已无声无息地迅速进入人类生活。Bots和我们的关系是如此密切,以至于我们几乎感觉不到虚拟机器人天天陪伴在身边。
聊天机器人,是应用最为广泛的一大类Bot,也被称为Chatbot。聊天机器人是用自然语言处理(NLP)等AI技术,来辅助和模拟人类对话活动的软件程序,用于手机等移动终端和PC机等桌面终端。
苹果的Siri、谷歌的Assistant、微软的Cortana(小娜)和Bing(小冰)、百度的度秘等语音助手,入口都是聊天机器人,即Bots。而在微信、QQ中,也存在大量的聊天机器人。由于聊天机器人无处不在,Bots甚至常常成为它的代名词。
聊天机器人的历史,可以追溯到AI史前。1950年,计算机和AI科学的前驱人物阿兰·图灵提出了有名的图灵测试——让机器和人对话,如果人不能识别对方是机器,则说明机器具有智能,是“会思考的机器”。图灵测试的设计,也被看成是聊天机器人的思想开端。1966年,麻省理工学院的计算机科学家约瑟夫·维森班(Joseph Weizenbaum)开发出第一个可以对话的聊天机器人艾丽莎(Eliza)。艾丽莎的角色设定为一个精神治疗医师,可以和人聊心理情绪方面的问题。尽管艾丽莎无法理解对方语言的含义,仅仅是模拟了心理治疗中的简单会谈法,但初次对话的人仍然感到惊讶和欣喜,觉得像是在和真人聊天。2011年2月在美国综艺节目《危险边缘》中打败人类的IBM沃森(Watson),则是一个很高级的聊天机器人系统,它具有很强的自然语言处理、信息检索、知识表达和推理、机器学习等能力。这时的聊天机器人,功能得到很大的提升,应用也变得广泛起来。
约瑟夫·维森班开发出了第一个可以对话的聊天机器人艾丽莎。
2016的Bots热潮
虽然聊天机器人历史悠久,但Bots热潮真正掀起,还是近年的事情。2016年,Bots的发展进入一个高潮。
在这一年,科技巨头们对Bots的应用与开发,表现出前所未有的重视。2016年6月,脸书(Facebook)发布了Bots开发平台,希望在Facebook Messenger上量产聊天机器人。很快,有2万多名开发人员注册了Facebook的Bot开发引擎,很快开发出3万多个Bots。这种速度,体现出Facebook和用户对Bots的热情。
谷歌当然不会示弱,2016年9月,谷歌收购了为Bots开发者提供工具的API.AI团队。API.AI作为聊天机器人开发平台,提供语音识别、语义理解、上下文管理等功能的技术支持,并鼓励开发者针对特定机器人的独特需求提供领域知识,来强化聊天机器人智能。谷歌的这次收购,同样是为了迅速提供大量的Bots,增强自己这方面的竞争力。Bots在谷歌的热度,从一个侧面可以看出:著名未来学家、奇点理论鼓吹者雷·库兹韦尔(Ray Kurzweil) 在奇点论坛上宣告,他和他的谷歌团队也正在做聊天机器人。
在聊天机器人领域布局很早的微软更是当仁不让。微软推出了开发框架Bot Framework,鼓励第三方制作Bots。微软CEO萨蒂亚·纳德拉(Satya Nadella)说,聊天机器人“将从根本上变革所有人的体验方式”。他还认为,“当前所有的应用开发者,无论是开发移动应用、桌面应用,还是网站,都将尝试聊天机器人并将其作为新的界面,以人类语言为基础的界面,而不是以往的菜单界面。”他的话表明,聊天机器人很可能成为微软战略的中心、竞争的利器。
而握有Siri王牌,在聊天机器人领域自成一体的苹果公司,也改变封闭传统,对第三方开放Siri语音接口。首批支持Siri的包括微信、滴滴、支付宝等源于中国的应用。
苹果公司不得不开放,因为语音交互的各种Bots正在疯狂生长。应用和开发者数量增加的速度,远远超过当年移动终端上App兴起之初,而且开始出现了Bot Store(虚拟机器人应用商店),直接挑战苹果公司的App Store(应用程序商店)。这种Bots将大量取代App的趋势,让苹果公司不敢掉以轻心。
为什么Bots在2016年突然走红?有两个重要的原因,一是AI近年来的突破性发展,尤其是深度学习和大数据的应用,使以往很复杂的语音识别和自然语言处理等技术变得越来越普及,Bots技术的开发门槛大幅下降;二是互联网上各种应用涉及到信息巨大而混乱,海量的文字、音频、视频充斥着互联网,往往超过处理的极限,需要更智能更高效而使用更简单的工具来处理。
Bots无处不在
Bots的主要任务不是为了聊天,而是完成特定任务,聊天只是作为一个人机交互的入口。目前的人机对话系统一般有四个主要功能——聊天。知识问答、任务执行、推荐。Bots像是一位助手、一位客户服务人员,在跟你聊天的同时了解你的意图和需求,帮你处理相关的事务,完成你想完成的工作。用过Siri和其他语音助手的人都深有体会,Bots很聪明,隐私保护方面也做得很好。与Siri等语音助手很轻松地聊天之间,它可以直接把你带向了解新闻、检索知识和信息、推荐景点和旅游行程、网上购物等等服务。而且,由于采用人机对话的Bots系统能够支持多轮对话,交互性比搜索引擎更好。
所以,聊天入口后面有无穷的商业天地,这也正是互联网平台和其他商业机构高度重视Bots的原因。
社交和即时通讯(IM)互联网和移动互联网平台,不但是Bots开发支持平台,也是运营平台,提供各种服务的机构和个人则利用这些平台开发和部署面向自己服务对象的Bots,满足用户的要求。我们熟悉的微信个人号、群、公众号和服务号,它们的自动回复等很多功能其实都是虚拟机器人来实现的。事实上微信也对运营者开放了接口,允许他们接入采用第三方服务设计的Bots。中国的各种互联网平台上,Bots的开发和应用也正在迅速增长。
由于平台的支持,提供服务的商业机构和个人开发Bots变得越来越简单,有时候只需要动动指头,一个Bot很快就生成了。也由于这种便利性,商业机构和个人乐于把自己提供的具体服务变成 Bots,放到平台上。披萨速递公司达美乐 (Domino’s)的用户,可以在微软的Skype上用Bots点披萨;新闻媒体CNN 和天气服务机构Poncho的用户,可以在Facebook Messenger上通过Bots获得服务。小公司和个人,更是对Bots怀抱希望,成为创业新热潮,Bots于是蔚然成风。
具有语音交互等界面、功能强大、制作和使用简单的Bots应运而生,可以看成为是AI深入发展背景下各种应用软件的一次智能化升级。
早已在银行、电信和各种服务性平台中广泛使用的Bots,是很好应用实例。在这些行业中,聊天机器人智能客服系统已经发挥相当大的作用。Bots能代替人进行重复劳动,这刚好是人力密集型的客服业所急需的。大部分智能客服所实现的功能,都建立在自然语言处理技术以及企业知识库的基础上。企业知识库包含了三个部分——基础对话库、领域知识库以及领域业务库。基础知识库支持通用程度较高、与业务无关的日常对话;领域知识库支持回复客户可能咨询的业务相关问题,是自动回复的关键部分;领域业务知识库则存储业务流程,支持将客户引导至具体咨询问题的解决环节。随着客户咨询量的增多,所获得的大数据通过机器学习改善系统,逐步提高客服机器人回复的准确程度。
中国建设银行是全球第二大银行,Bots智能客服系统每日能处理两百万交互量,节省6000个客服座席,每月减少两百万电话,节省4000万人民币。
金融业中的Bots作用远不止这些,虚拟机器人早已介入从投资决策到股票交易的全面活动。而在IT业,Bots一直在监控服务器运行,自动修复Bug;在办公室,Bots会安排会议日程、计划出差行程;在人事部门,Bots自动进行员工背景简历的调查审核,辅助人事管理;在商业公司,Bots自动分析市场信息,甚至在销售之前就能预估产品销售情况;在媒体业,Bots采集整理新闻数据,自动撰写新闻报道……
无论是对话型Bots,还是大量的非对话型Bots,目前都在迅猛发展。我们身边,虚拟机器人虽然无形,却将无处不在,无时不在。
各行各业,纷纷用Bots来增强自己的竞争力。亚马逊老板杰夫·贝佐斯(Jeff Bezos)麾下的《华盛顿邮报》是虚拟机器人应用的典型,他们一直不断地提升新闻媒体的科技含量。Bots在《华盛顿邮报》的应用十分普遍,已经开发了100多个用于工作的机器人。
在《华盛顿邮报》,有“感受机器人”用于分析受众对某一新闻事件的感受,这是面向读者的机器人。例如,大选投票前30 天,机器人就会在每天晚上询问受众对大选现状的感受。受众只需很简单地从很生气到高兴五个表情中选择,表示出自己的感受。机器人收集处理这些情绪信息后于第二天早上给出反馈,让受众看到全体被调查者的反应。接受调查受众上万人,统计处理这些数据的却只有一个人。机器人还将受众的感受和精彩回复及时分享在《华盛顿邮报》官网和社交媒体上。
也有“流量预测机器人”,在文章发布前就开始工作,发布后自动进行监测,30分钟内就能估计文章流行度,并监测24 小时的流量。而且,机器人还会自动向内容生产频道反馈流量信息,帮助补充和扩展后继内容。24小时流量监测的结果会形成一份分析邮件报告,让人直观地看到新闻内容生产传播和反馈的过程。《华盛顿邮报》的员工评价,这是一个实用性特别强的新闻业务工具。
还有“截稿提醒机器人”与内容发布日程系统连在一起,无论记者何时开始着手写文章,机器人都知道他们确定的预计完成时间,如果进度落后了,机器人就会提醒可能接近或错过截止日了。机器人善解人意,都是单独发私信,不会让人感觉尴尬。
“会讲故事的新闻机器人”Heliograf,是《华盛顿邮报》最有人气的机器人,中国读者也不会完全陌生,因为在2016年夏天的里约奥运会上,Heliograf曾经与今日头条的机器人记者小明同台竞技。
Heliograf机器人可以从数据源收集实时信息,按照模板自动为不同的频道撰写新闻报道故事,并自动分发到不同的媒体传播平台。甚至,Heliograf机器人还能为读者提供私人定制故事。
《华盛顿邮报》的Heliograf机器人已经参与了去年里约奥运会的报道
机器人在全球新闻行业应用相当广泛,新华社、《纽约时报》、《洛杉矶时报》、《卫报》、路透社、美联社等国际著名媒体机构,都有自己的机器人写作和其他业务辅助机器人系统。
虚拟机器人在新闻行业的应用,是Bots在全社会广泛应用的一个缩影。随着虚拟机器人的开发越来越简单、使用越来越简便,带着AI强劲新风的Bots已经大步走来,虚拟机器人正变成我们一刻也不能离开的忠实朋友和助手。