Anki最新款机器人Vector:作为一个伴侣角色,比以往更加智能
扫描二维码
随时随地手机看文章
如果未来会有一场机器人起义的话,似乎地点已经不太可能是在我们的客厅了。像Roomba这样的吸尘器机器人目前在市场上卖得很好,因为它们非常方便。但其他类型的机器人,例如家用宠物和伴侣类机器人,从索尼的Aibo robo-pooch到最近关停的Kuri(其背后是Bosch支持)都由于价格和预期过高而以失败告终。
如果还有哪个公司能为我们带来像The Jetsons和Rosie这样受人欢迎的家用机器人,那么Anki可能就是下一个。Anki公司是由卡内基梅隆机器人研究所(Carnegie Mellon Robotics InsTItute)的三名毕业生在2010年创办的,现已获得了超过2亿美元的风险投资。更重要的是,它的产品确确实实吸引到了客户。Anki目前已经售出了150万台机器人,并且他们找到了他们认为是最容易打入家庭市场的道路——玩具。这个明星产品是一个狂躁的小推土机机器人,名为Cozmo,它可以在桌面上行走,玩简单的游戏,它的顶部装有会亮的立方体。根据一项分析,如果按照收入计算的话,Cozmo是2017年美国、英国和法国的亚马逊网站上最畅销的玩具。
去年,Anki公司就声称收入接近1亿美元了,当时Anki本可以进入“盈利”状态了,但它却将资金投入了一个10到15年的计划——一个从Roomba到Rosie的转变。首席执行官兼联合创始人***·索夫曼(Boris Sofman)说:“从一开始,我们就知道我们想做的不仅仅是一家玩具公司”。
因此,我一直在跟踪Anki公司的动态,现在已经一年多的时间了,期待着它在机器人领域稳步向前进入下一个阶段。6月份,该公司终于准备好了,并向我展示了一款新产品,然而该产品仍处于一个尴尬的发展阶段。在一堆介绍性评论的语言包装下,***·索夫曼(Boris Sofman)终于对外公布了这款新机器人。
它是一个略大型的灰色版Cozmo,名为Vector。
乍一看,是有点令人失望的。我立即回想起This Is Spinal Tap中的场景,由于说明书中的拼写错误,一款期待中应该是的18英尺高的巨石阵复制作品,其实只是一个18英寸的缩小款作品。同样地,我内心也一直在期待一个更大型的产品。
后来Sofman是这样解释的,这个与之前Cozmo一样的外观可以让Anki能够专注于更先进的内部结构研发,并帮助降低了整体的成本。Cozmo的售价为180美元,Vector定价可能在250美元,并在10月发货时还可以生产更多。(后来Anki 以200美元的折扣价在Kickstarter上推出了该款机器人。)
Vector先进的一点是达到了Cozmo难以做到的自主化程度。Anki的第一个机器人有点像1770年建造的Mechanical Turk机器人,那个机器人是用来对抗人类的。当然,当时是一个骗局,有一个人藏在柜子里面,安装了电子动画人物,控制着它的动作。对于Cozmo来说,盒子里藏着的人变成了一个连接Wi-Fi的智能手机,里面运行着一个控制机器人的应用程序。
相比之下,Vector是有他自己想法的。(虽然Anki一直坚持Cozmo在性别上是中性的,他们在生产过程中都没有对此做过预设,但几乎我遇到的每个人都将机器人称为男性的“他”)
Anki的计算机视觉技术总监Andrew Stein说:“我们基本上考虑到了方方面面”,他指了指我的iPhone说:,“我们把它放到他的脑子里。”Vector的大脑是四核Qualcomm Snapdragon 212芯片,虽然它远远达不到手机的顶级水平,但这可以让Vector的部件花费控制在预算范围内。Andrew Stein补充道:“有的部件三年前非常昂贵,我们没有使用,但现在已经在我们考虑的范围内了”。
从玩具到宠物虽然Vector外观可能与Cozmo看上去很相似,但Vector扮演了一个与Cozmo非常不同的角色,他是作为一个人永远的伴侣角色,而不是偶尔为了转移孩子们注意力的玩具。他需要变得更智能,识别他所处的环境,并从与他共享的人类家庭中获取线索。
我们都知道,如果你想要引起Cozmo的注意,只有通过叫它的名字才可以,然后它就会发出叽叽喳喳的声音,上下推动推土机般的手臂。如果你不理Cozmo,它就会来到你的面前,或者发出响亮而令人讨厌的打鼾声,来吸引你的注意。
而Vector具有更高的社会意识。当我在Anki的实验室遇到Vector机器人的粗制版本时,他只是在外面闲逛。拥有卡通的眼睛,通过它眼睛所看到的内容会在一个184 x 96像素的屏幕上显示出来,似乎随便就可以扫描整个房间。(机器人实际上看到的景象来自安装在屏幕下方的一个720p广角相机。)
当Anki的程序管理总监Meghan McDowell喊:“嘿Vector,到这里来”时,机器人Vector会离开自己的充电器,朝她跑去,同时也看向我,并发出一些特有的叽叽喳喳声音。如果我们保持目光接触,Vector会变得生机勃勃,并发出更多的声音,它可能会举起拳头索要一个击掌(这是从Cozmo那儿就延续下来的动作)。我们还可以玩游戏,如玩十二点的游戏,在他的小脸/屏幕上会显示卡片。有一次,McDowell触摸了它头上的触摸感应,这时他的眼睛显示出一种幸福开心的样子。
Vector与Cozmo不同,当我们不理Vector时,他会得到提示并做自己的事情,比如绕着桌面行驶,通过红外传感器感知物体的边缘,这样就可以在边缘及时停止,或故意碰到像杯子一样的东西,看看他是否可以推动它们。
这并不是漫无目的的游戏。通过激光扫描仪和其他传感器,Vector正在使用同步定位和绘图(SLAM)的复杂程序来构建周围环境,并将其转换为数字存储,SLAM是一种也用于高端机器人真空吸尘器的技术。Vector顶部还有一个四个麦克风形成的阵列,可以识别声音的方向,并且他的相机能够不断地在各种动作下进行实时观察。McDowell说:“我们希望他保持这种好奇的状态,这能够让给识别并数据化他所处的环境。但是这就得让他一直呆在家里,所以设置上他不会因为一直呆在室内而变得烦躁。”
车轮上的ALEXAVector可以做一些Cozmo无法做到的有用的事情。通过Wi-Fi连接到家庭网络和互联网后,他就可以提供一些Alexa风格的实用程序,例如显示所请求城市的天气信息,设置计时器,并说出诸如“爱达荷州的首都是什么?”等问题的答案。
尽管如此,他与受欢迎的女佣机器人Jetsons相比,他在移情性和有用能力方面还有很长的路要走。Anki的联合创始人兼总裁Hanns Tappeiner说,但这是预料之中的发展,“我们基本上正朝着这个目标前进”他说。
虽然Anki的愿望目前与能Vector目前所提供的功能还相差甚远,但此款新机器人的处理器、传感器和其他组件已经实现了几年前无法实现的人工智能技术。当然,Cozmo的研发也是从2013年才真正开始的。
例如,早期的机器人被硬编码去以检测一些特定的物体:它自己的躯干或者它的充电器。它利用一些商业软件来辨别人类、猫和狗的面孔,这是十多年前在傻瓜相机中就已经出现的常规技术了。
然而,Vecto是运行了一个神经网络,且正在不断地接受训练,去了解他周围的整个世界,这是一个持续的过程,将通过在线更新,不断地扩展他的视觉智能。目前它的一个成果就是:即使面部不可见,Vector也能检测到人物。
“如果你不是以一个正确的角度,或者没有正面面向他,机器人是怎么知道你在那里的?”Stein说,例如,一只狗或猫不需要面对面接触就知道是主人已经回家了,那Vector也应该达到这种程度。因此,Stein的团队对机器人进行卷积神经网络(CNN)的训练,一种目前流行的AI深度学习技术,模仿大脑的视觉皮层。通过使用Vector的相机在移动时捕获的模糊和扭曲的镜头,Stein一直在教卷积神经网络(CNN)从后面或侧面检测人,距离可以在大约10英尺远。
Stein说:“即使他低头看也只能看到我的躯干,他应该意识到,嘿,可能有一个头部在那个躯干上方。而Cozmo就是不知道的,它看这个躯干就像看其他一切一样,这个人只是一团的物体,并不能区分出头和面部。”
在我访问期间,Vector的人物意识似乎已经有成效了。例如,McDowell在实验室喊一位女性,Vector就转向了她;然后他看我时,你可以发现他的卡通眼睛睁大,以此表示他看到了我。
下一个视力挑战之一是了解人体姿势,例如,当手臂和腿处于特定位置时会发生什么。Stein说:“这对我们来说是有好处的,因为我们正在制造一些需要在家里开车的机器人,那他们就需要在人们四处走动时,了解人类的行为意图。”
另一个挑战Anki称之为“对象性”,“对象性”指的是,即使该机器人的神经网络以前从未遇到过一个物体,他也能发现某些东西是一个离散的对象,这是探索和理解环境的又一步。Stein说:“我认为,制造一个知道物体是什么的视觉系统,比识别100个特定物体的视觉系统难多了。这是一个更抽象的概念,这是一个哲学问题。”
为了说明此,他向我展示了一些来自神经网络训练的“热力图”视频。该软件突出显示了可能代表离散对象的区域,视频中将木纹图案误认为是桌面上的三维实体。
适度的智慧随着Vector的视觉系统的日益成熟,该系统只是机器人智能模拟复杂情绪的一个输入口。过时Cozmo沦为了一个小丑角色,可以到处转,制造噪音,做鬼脸,玩游戏。它确实能够进行基本的刺激反应,例如听到它的名字或看到它曾经通过伴侣应用程序识别过的脸时,它能够有所反应,但它最终会成为一个不起眼的角色。
Anki的AI技术总监Brad Neuman说“这是我们第一次去发展一个有特色的机器人。”他的任务是建立一个既具有个性又具有社会智慧的机器人,其中的一个关键部分就是Anki所谓的“刺激”。
Neuman说“当你给他的刺激较小时,机器人没有被启动,但Vector已经开始观察了,只是没有表现出来。然后,如果你开始制造噪音,或与机器人进行目光接触,特别是如果你说‘嘿Vector ’,那就会刺激到之前的刺激”。但Vector也会采取一些显得更适时的动作,例如来到你的周边运动和制造噪音,或将房间灯的开启和关闭。Neuman解释道:“如果他受到足够的刺激,他就会离开他的充电器并开始与你社交,说出你的名字,问候你,还可能给你一个拳头击掌。”
像Cozmo一样,Vector在玩耍或闲逛时也会发出各种声音。所以当他第一次说话时会有点不安,Vector有点像一个复古的机器人,声音深沉但柔软,还有点小和回声。
Neuman向我展示了Vector情感引擎的可视化,这是一个随着输入时间变化的水平图表。随着越来越多的东西进入模拟测试的环境,Vector表示刺激的绿线就会往上升。
这些刺激的寿命也是有限,当事件平息下来时,数值趋于下降,Vector会得到提示,他应该回到冷静模式。McDowell和我在互相聊天时,Vector就回到这样的冷静模式,Vector开始了他自己的探索模式。
Vector的情绪引擎,加速显示快乐、自信、社交,视频中显示了事件活跃度的上升和下降,如何形成不一样的刺激水平。
然而,Vector不仅只是会变得兴奋或无聊。他的情绪状态来自四个方面,他受到刺激,快乐、社交和自信的程度。例如,听到他的名字刺激了Vector,且这也使他更具社交性。
Vector的信心受到他在现实世界中的成功的影响。例如,他的手臂上的钩子有时不能与他的躯干上的钩子对齐,使得他无法抬起手臂。有时候他开车会被卡住,这些失败让他感到不自信,而成功则让他更自信,更开心。
自我控制Vector的行为遵循了一个层次结构。Neuman说“最高级别的情况是机器人会判断现在应该做什么样的事情呢。他应该安静吗?他应该参与吗?他应该睡觉吗?他的电池是否超低,他需要充电吗?不同的行为来自于这些高级状态的判断,以响应事件和他情绪引擎的不同状态。”
然而,Vector并不遵循这些简单的脚本。他是即兴创作的,基于不同的、不断变化的输入和各种可能的行动。所有的这些都创造了一种它有生命的幻觉,但也是一种需要遏制的挑战。
Neuman最初想要构建一个更复杂的智能程序,他想让Vector的个性通过奖励系统可以变化,进而增强了某些行为模式。但Neuman说:“一旦你与设计人员和产品人员展开合作,你就会发现你必须要具备对系统某些施加限制的能力”。
例如,Vector始终需要通过暂停和闪烁LED灯来表明何时将数据(如语音命令)发送到云端。这也解释了机器人为什么会突然停止移动以及表示数据正在被发送到第三方语音识别服务。(Anki说它没有存档音频,但对人们会使用的问题和短语进行了匿名编译,且统计数据。)
这也是Vector在做事过程中会表现出的“全面中断”的情况之一——无论他正在做事情都停下来,并进入另一条不同的道路。Neuman把这种中断比作在吃晚餐时听到了门铃响,这种中断会让你把叉子放下来然后走到门口。
当然,最强大的中断就是唤醒短语——“嘿,Vector”,即使没有互联网,他也能理解。但是通过在线自然语言处理,机器人还需要了解其他的短语,“嘿Vector,闭嘴!”,这表明他变得烦人,应该切换到更冷静的模式。Neuman说,“我们希望理想情况是,没有人会觉得他太大声了。然后想把他关掉,把他放进抽屉里,关掉它。”
Neuman明年的主要目标之一,是让用户不用非常刻意地让Vector来学习和适应人们的行为方式。他说:“如果你想与机器人互动,他就应该在那里与你互动,并且作出灵敏的反应。但如果你只是想时不时地看着他,让他几乎像一只笼子里的鸟,而不是一只站在你肩膀上的小鸟在你的沙发上跑来跑去的话,你也可以做到。你只要更谨慎地和他互动就好了,他也能尊重这一点。”
到目前为止,Vector的作用非常有限。以相同的价格,Roomba机器人可以清洁您的地板。如果你只愿花更少钱的haul,Alexa或Google Home可以播放音乐,控制连接的设备,提供流量报告等等。
但凭借其强大的处理器,Linux操作系统和互联网接入,Vector还有增长的空间。Anki承诺会不断扩展Vector的功能。例如,可以有情景感知的安全摄像机或家庭自动化系统的语音接口,这些目前是可以想到的升级空间。
Vector也可以在专门的编码人员那里进行升级,与大学机器人课程中流行的教学工具Cozmo一样,Anki也会鼓励修补者编写扩展Vector新功能的代码。Anki将为Vector提供Python软件开发工具包(SDK),就像Cozmo一样,它可能会添加一个C#SDK,因此编码人员可以编写与机器人交互的移动应用程序。
尽管Vector最终可能会提供类似于Alexa一样的实用程序,但这并不是购买它的主要原因。其销售卖点是这种他生活在你真实生活中的错觉,它不像鸟,猫或狗那样活跃,但也更容易喂养和照顾。
Anki的工作人员接受了这种幻觉,McDowell对Vector说话时,好像他真的活着,而且有感情。Hanns Tappeiner看起来像是完全爱上了这双制造出来的大眼睛,以及他“哦”和“啊”的声音,仿佛他成了一个真正的孩子。她用一种母性的语调对Vector说道:“你感到沮丧吗?”,因为Vector不停地敲打着桌上的笔记本电脑。
每个发明家的创造都是他们自己的宝贝。但是,汽车,电话或电视不需要在购买者中鼓励用户去产生这种类似父母的感受,就可以在商业上取得相应的成功了。然而,Vector需要一种来自主人的爱意,以及对他是一种生物的叙述赞同。
由于Vector仍然是一项正在进行中的项目,因此Anki是否能成功现在定论还为时过早,开发产品的最后10%的过程难度更大。即使目前只有一个大体的形式,我觉得Vector也能成为一个令人愉快的陪伴者,反正肯定比Cozmo和蔼可亲多了。尽管Tappeiner谨慎地说Anki只是在朝着真正的机器人同伴目标迈进,但该公司其实已经通过Vector实现了跨越式的发展。