不管你喜不喜欢,Duplex很快就要来了!
扫描二维码
随时随地手机看文章
在谷歌I/O开发者大会召开的一个月后,谷歌召集了几位记者在曼哈顿召开会议。对Google这家世界上最大的公司之一来说,这是一个不同寻常的地方。桌子被移出,为九把椅子腾出空间,共计三排,每排三座,面对着一个巨大的、明亮的显示器。旁边,四名谷歌员工坐在临时控制中心的办公桌后。Duplex在推出时曾引起广泛讨论与争议,Google公司终于准备好提供一种对Duplex更深入的解读。
这家舒适的纽约餐厅对这类活动来说意义非凡,因为Google公司拉开了基于人工智能预订服务的帷幕,餐厅的老板坚持认为,这样的服务对于每天多达100多个预约的餐厅来说,真是天赐之物。对谷歌来说,显然是时候为这一AI系统的设计目的和背后的运作方式提供更多的“透明度”了。
CEO桑达尔·皮查伊(Sundar Pichai)展示的简短演示,引出的问题远比其回答的要多。众多观点开始涌现,探讨了这一AI系统所能带来的技术道德问题。Duplex AI系统可以实现逼真的拟人效果,让企业相信其在和一个人说话。
“Duplex”代表着一个罕见的早期投射,主导这个正在进行中的项目的公司因似乎谨慎地策划着什么行动却隐藏自身意图而声名狼藉。然而,信息披露是关键。就像自动驾驶汽车一样,需要严格的现实测试来消除系统中的所有问题。
谷歌公司今天在一篇博客文章中写道:“虽然我们还没有广泛发布这一功能,但我们正在分享更多关于这项技术的信息,以提供透明度和鼓励反馈,重要的是,我们要为员工和企业提供正确的体验,而且我们正在采取一种缓慢而有分寸的方式,因为我们在测试中加入了学习和反馈。”
谷歌这一过程的性质很可能会以某种方式出现,因此I/O大会上的宣布有双重目的,其一是为了让自己站在这一叙述的前面,其二是在该公司最大的舞台上呈现一个雄心勃勃的项目。皮查伊(Pichai)在主题演讲中说:“你将听到的是谷歌助理打给一家真正的美发沙龙店来进行预约。”
“嗨,我打电话来是为了预约一个女士理发项目。
嗯...我希望定在5月3日。”
——谷歌助理
“当然,给我一秒钟。”
——接待员
“嗯...嗯。”
——谷歌助理
在这里,观众们都笑了,起初难以置信。紧接着给予掌声。我们很难相信,我们听到的只是谷歌人工智能助手的一个纯自动化版本。“嗯...嗯(mm-hm)”的语气词是锦上添花——这是一种微妙的声音,透露出谈话还在进行中以及带有使谈话更自然的延迟。
语言学中所谓的“言语障碍(speech disfluencies)”,是语言中正常的、常见的部分,也是使Duplex成为一种非凡产品的秘密武器的关键部分。除此之外,它们是系统的一种礼貌的变通方式。
例如,如果Duplex在要求为5人的派对预订房间后面临不确定的回应,那么它将会以微小的变化重申:“嗯,5个。”这能解决接线人员的潜在困惑,同时也将一种微妙的语言标记包含在内,为谈话提供了进一步的真实感。
这些元素是Duplex工作中的一个非常真实的部分。至于在大屏幕上播放的两个演示,实际上,它们是真实的。更有趣的是,该公司表示,在电话发出后,它通知了企业,似乎为这一过程提供了额外的真实性。
目前,“Duplex”仍然是一项正在进行中的项目。此外,该系统还没有在早期提供信息披露,这一事实可能违反了在康涅狄格州、佛罗里达州、伊利诺斯州、马里兰州、马萨诸塞州、蒙大拿州、新罕布什尔州、宾夕法尼亚州、华盛顿州和谷歌所在的加州总部等地记录电话和通话的“双方同意(two-party consent)”规定。
新闻自由记者委员会技术与新闻自由项目主管Gabe Rottman说:“在这里,从一开始到现在的问题,不仅仅是Duplex的问题,还涉及到机器语音的更广泛的法律意义。”如果这项服务扩展到所有方的同意状态,或者在全球范围内,你可以看到问题出现,比如,如果你不知道来电者是一台机器,同意是否有效。像这样的难题将会成倍地增加我们进入恐怖谷的次数,在那里,自动语音可以作为人类语音传递。”
展望未来,该系统将局限于那些法律使其可行的州。这也适用于州际电话,只要双方都能被覆盖。谷歌助理副总裁尼克·福克斯(Nick Fox)说:“我们想要确保它的运作方式受法律规定的约束。”尽管披露的信息还没有出现,但该公司从一开始就表示打算将这些信息添加进去。然而,这种动机并不是因为法律后果,而是常见的机器人/人类礼仪。
谷歌公司在一篇博文中写道:“谷歌Duplex技术的建立的目的是为了让对话听起来自然,让对话的体验感达到舒适。”“对我们来说,用户和企业对这项服务有良好的体验,这一点很重要,而‘透明度’是其中的关键部分。我们想要清楚地了解通话的意图,以便企业了解上下文。我们将在未来几个月里试验正确的方法。”
在媒体的追问下,这种“透明度”最终将会是什么形式,Google公司的一位发言人后来补充说,“我们理解并重视围绕谷歌Duplex的讨论——就像我们从一开始就说过的那样,技术的透明度很重要。”我们正在设计这一功能,并内置了信息披露功能,我们将确保系统被正确识别。我们在I/O大会上展示的是一个早期的技术演示,我们期待着在开发产品的过程中加入反馈。”
从目前的形式看,这是很有意义的:
“嗨,我是谷歌助理,打电话来给客户做一个预约。”这个自动调用将被记录。
“Duplex”并没有透露它是人工智能的事实——但如果你对谷歌助理有一定的了解,你就可以把这部分整合到一起。但是,它确实让你知道电话正在被记录。谷歌将这些对话记录下来,用于文本处理和质量保证目的,因此谷歌公司可以继续修改和完善系统。
在我的测试电话中,我试图让Google助理重复这一段——很容易就能听到这句开场白,尤其是当你把手机放在一个拥挤的餐厅里时。但是人工智能只是在预定的情况下继续使用。如果你错过了信息披露,你就没那么幸运了——至少现在是这样。目前,选择不被记录的唯一方法就是挂断电话——这显然不是获得回头客的最佳方式。
谷歌助理副总裁Scott Huffman解释说:“我们确实有一种机制,它会说‘好吧,我不会记录你的语音’。我认为我们仍在搞清楚在这里做什么是正确的。退出是正确的吗?基本上把录音去除?”就像其他所有人在那天做演示一样,我尽我最大的努力把这个系统关掉。助理要求预订在下午6点。我告诉它我们要到11点才开门——这是曼哈顿。助手礼貌地结束电话——或者像谷歌所说的“退出”。
这里“努力想得到却永远无法获取的”是试图用图灵测试从Duplex找出欺骗之处。如果你成功了,谷歌的一个人工操作员将会采取相应的控制。这些人工操作人员是Duplex测试的一个重要组成部分,谷歌表示,他们计划以某种形式将其保留在未来,以确保事情永远不会失控。最终将会有多大的群体还有待观察。
在我们的简短聊天中,我们的小组中没有人成功地调用了一个真实的人,尽管我们对系统的局限性有一些重要的见解。例如,当被要求“重复最后四个数字”时,它会完整地重述电话号码。这并不是一个缺陷,但它确实显示了一个简单的地方,即系统在理解人类对话微妙的细微差别时,被推到了它的极限。
另一方面,当被问及用户的电子邮件地址时,系统只是简单地说,它没有获得“客户”的许可来公开这些信息,以此来维护整个“助理”关系。谷歌表示,在测试中,该系统也会因使用电话树(交互语音应答系统)而遇到另一台机器。仔细地听,因为我们的菜单选项已经改变了,现在还没有计算出来。
目前,谷歌表示,Duplex能够完成五项完全自动化的任务。百分之八十是相当不错的,但是Google正在努力使事情变得更好。“我们希望确保我们不会浪费公司的时间,”福克斯说。“我们想要确保我们在这里所做的每一件事,这对企业来说是一种很好的体验,而且当他们试图经营自己的业务与助理交谈时,他们不会感到沮丧。”
正如在/O大会中所宣布的,更多的测试将在今年夏天开始。而在“未来几周”,下一轮将会是助理展开对营业时间的询问。在接下来的几个月里,它将扩展到餐厅预订和美发沙龙的预约。与在I/O大会上的演示不同的是,将会出现“一组有限的受信任的测试人员和选择的企业”,他们将会参与其中。
到目前为止,企业似乎都渴望加入。正如谷歌在今年4月进行的一项客户调查所显示的,“60%依赖客户预订的小企业没有建立在线预订系统。”
对于那些不想接电话的用户来说,Duplex提供了一个令人信服的替代方案。对于这些企业来说,这意味着增加更多的潜在客户。另一方面,那些因为各种原因而不愿加入的人,将能够通过他们的谷歌商业清单(假设他们有一个)而选择退出。如果你使用,客户可以用谷歌助手预订。另外,通过偶尔调用来确认你的详细信息,以快速更新你的清单。
谷歌的负责人介绍,自从Duplex开始成为一款临时拼凑的演示程序(在MacBook上小心翼翼地放置了一款办公电话)以来,这个系统已经走过了很长一段路。Duplex是通过语音到文本、文本到语音的复杂组合和谷歌自己的WaveNet音频处理深层神经网络来运作的。早期的演示并没有像一些人猜测的那样存在,但实际上它们是真实的——而且事情只会变得更令人印象深刻。
不管你喜不喜欢,Duplex很快就要来了,唯一能阻止它的办法就是挂断电话。