会说话的会说话:未来交互之道的曙光初现
扫描二维码
随时随地手机看文章
据国外媒体报道,坐在位于曼哈顿中城的办公室里,JP·贝尼尼(JP Benini)随意对自己的智能手机说了句:“你好!”
突然,他身前一只坐着的绿色塑料恐龙仿佛活了过来,用卡通般的声音说道:“嗨!JP,有什么事吗?”
“你听起来就好像‘甜饼怪兽’,”贝尼尼说道。
“有什么不好吗?”恐龙回敬道。“甜饼很好吃哦!”
这只恐龙看似普通,但却凝聚了数年的工作结晶,上述对话背后的技术花费了数百万美元的研发费用。该产品原型由Elemental Path创建,这是贝尼尼一年前作为联合创始人发起的另一家公司。原型产品使用了IBM沃森认知计算平台来驱动,使得上述对话成为现实。贝尼尼的公司计划于今年11月开始通过CogniToys的品牌销售这种可联网恐龙玩具,每只售价100美元。
贝尼尼希望他的产品可以开创一种全新的玩具品类,能够寓教于乐,回答孩子们成千上万的新奇问题,传授数学知识,并且通过互动与自己的小主人共同成长。
但是,让计算机通过流畅的语言与人类交流,这一天的到来还为时尚早。
贝尼尼通过智能手机问这只被他命名为“道格”的恐龙:“猎豹的奔跑速度有多快?”道格沉默了大约半分钟,期间茫然地看着它的主人,然后说道:“猎豹的速度最快可达每小时75英里。”
话唠机器人
在过去3年里,计算机语音助手出现在数以百万计的设备上。苹果的Siri、微软的小娜以及谷歌的Google Now让智能手机用户可以通过语音命令询问路径、拨打电话以及安排日程。亚马逊的Echo扬声器就包括了一个名为“亚历克斯”的助手,能够播放音乐,同时回答简单问题。
这些系统都将重点放在提升工作效率上,很少有针对玩具设计的语音技术。这方面的关注有望推动技术从简单的问答向自然语言方向发展。这不但反映了玩具的未来方向,广义上来说,这也预示着人机交互的未来。
有了这些能够和自己说话的玩具,孩子们的童年将变得更加梦幻。
奥伦·雅各布(Oren Jacob)是来自旧金山的ToyTalk的CEO,他表示,玩具在具备完全对话能力方面还有很长一段路要走。
在2011年创办自己的ToyTalk之前,雅各布将自己人生的20年花在了为皮克斯动画创建电影动画和图像上,他参与的作品包括《玩具总动员》、《飞屋环游记》以及《怪兽总动员》。ToyTalk的目标是创建具备交互能力的计算机角色,而灵感则来自雅各布自己的女儿,因为有一天女儿向雅各布询问为何她不能与泰迪熊说话。现在,雅各布的公司已经拥有了一系列可以和孩子们交流的角色,这些可爱的形象全都基于移动应用,其中包括了一个容易激动的黄色生物,名叫温斯顿。
今年秋天,ToyTalk计划首次将一个语音识别及人工智能平台置于实体玩具内部,公司与美泰携手推出名为“你好芭比”的玩具,这是经典女孩玩具的可联网版本。“你好芭比”售价75美元,而普通的芭比售价通常在10至25美元之间。
雅各布表示,ToyTalk的玩具目前还不能回答各种问题,其主要还是为娱乐目的而存在。而目前最长的对话记录为4个多小时,来自一个喋喋不休的孩子。
雅各布觉得,让孩子们认为自己真的在和一个活生生的角色对话是一件非常酷的事情。
隐私的担忧
抛开技术上的困难不谈,交互式玩具可能面临更多本质挑战:现在,这些玩具可以与孩子们互动,但是它们能够取得家长们的信任吗?
今年2月,“你好芭比”首次出现在纽约玩具展,迅即遭到一个活动团体的炮轰。该组织使用了“恐怖”和“窥探”这类字眼来描述该产品,其认为美泰会收集孩子们的说话,加以分析并用于商业目的。
雅各布表示上述指责纯属无稽之谈,他强调来自消费者的任何数据都绝对不会被用于广告或行销目的,而且父母可以聆听和分享孩子们的谈话,也可以永久删除。
Elemental Path也有类似政策。贝尼尼表示,这些数据会被用来提高玩具的交互性以及教育性,但绝对不会用户行销或广告目的,家长随时可以删除数据。
这类全新的可联网玩具已经处在《儿童在线隐私保护法案》的监管范围内,该法案让监护人对子女的信息拥有完全的控制权。
即便如此,上述担心的存在说明公司在消费者教育方面还有很长的路要走。
互动的世界
但是,潜在的消费需求相当巨大。
Elemental Path在Kickstarter为恐龙玩具开展众筹活动,目标是5万美元。公司在短短18个小时内便实现了自己的目标。此后,2600个玩具被预定,公司筹得27.5万美元。Elemental Path同时还从朋友和天使投资人处获得了100万美元的种子资金。
公司希望自己为恐龙玩具打造的系统能够以许可的方式授权给其他玩具制造商使用,同时还希望进一步扩大目标消费者的年龄层。
除此之外,贝尼尼还希望进一步提高系统对人类情感的感知能力,同时做出更加适当的回应。这能够让某些机械式交互过程不再那么乏味,例如今天常见的自动应答服务。
通过像IBM沃森这类人工智能系统,这一天可能很快就会来到。沃森目前对包括来自医药和金融领域在内的数据进行分析,但尚未涉足大多数人的日常生活。
“更高的交互水准不但能够让孩子们从中得到满足,而且可以让成年人自如地和设备沟通,”贝尼尼说道。“我们已经看到了曙光,未来世界的交互将会更加智能。”