Kinect创新潮
扫描二维码
随时随地手机看文章
真正伟大的创新,将会决定很长一段时间人类改变世界的方式,比如蒸汽机或计算机,而Kinect在这一视角下,几乎必然会成为一种关键力量。
微软公司首席研究官里克·雷斯特安静地坐在记者面前,温文尔雅,与他实际的身份相比,看起来更像是一个在大学呆了许久的教授。开始采访后,没想到我们第一个话题并不是关于微软,也不是关于计算机或互联网,而是蒸汽机。
整个社会每隔几十年或上百年,就会出现一次比较大的创新,可是这样的创新会给世界带来多大的影响呢?“你要了解这一点,最好的方法是去伦敦的大英科学博物馆参观,去看看里面那些个头巨大的蒸汽机展品。”里克说。
16世纪到17世纪,蒸汽机的出现和不断改良对英国社会和全世界产生了巨大的影响。曾几何时,蒸汽机是一切问题的答案——无论你想建造任何事物,或者开展任何工程,都可以通过设计,让蒸汽机来完成。
这是真正伟大创新的力量,它决定了之后很长一段时间人类改变世界的方法。而我们现在正在经历的或许与之相仿,只不过不是由蒸汽机、而是计算机所驱动的创新时代。如果说蒸汽机决定了人们改造和创造世界的方法,则计算机更多地为人类观察和了解世界提供了一种方法论,从广袤的宇宙到微小的细胞,乃至人与人的组织形态。
如果说人的进化在于对工具使用的不断升级,则我们正在面临一个工具再次革新的时代。在这样的背景下,Kinect正在通过对人机交互的改变,提供一种关键力量。
Kinect超现实世界
恰逢微软研究院20周年,记者有机会在西雅图参加了“微软技术节”(TechFest)的公开部分。虽然不能获知各种技术将如何与产品结合的进一步细节,但所看到的技术已经让人大为惊讶。走进展厅,密密麻麻的技术展示让人仿佛置身于科幻世界,其中大部分技术已经有了相当强的应用场景展示——如果它们真能应用到现实社会中,无疑将刮起一阵科技风暴。
Chris Harrison站在那里,他左边肩膀上放着一个奇怪的装置,那是一个微型Kinect和投影仪的组合。这个来自微软雷德蒙研究院的小伙子笑了笑,向前伸出了自己的左手,只见一片光打下,手中出现了一个Windows Phone的投影。
可这不只是投影而已,他用右手开始点击投影出的手机,一切开始运转,这个虚拟手机用起来和真实的手机一模一样。他尝试打了个电话,又打开相簿,偏了偏肩膀,图片开始在墙上更大的区域展示。
这玩意儿有个一看就懂的名字,“可穿着的多点触控交互”,是他正在研究的技术,能在生活中常见的表面上实现交互式多点触控应用。它不需要任何校准就可以提供类似鼠标或触摸屏的功能,不止如此,还能轻易识别手指在悬空状态下的指令,与2D的触摸屏相比,变成了一个“触摸空间”。
看似简单的搭配:Kinect识别动作、投影仪展示、用云计算处理信息,却产生了远远超过现有触摸交互的效果。通过距离判定,它还能进行身份判定,只识别使用者手指所进行的操作。想想看,与现在带个手机或平板相比,未来每个人可能只需要携带一个巴掌大小的装备就够了。
比这个更有趣的是Harrison的同事Hrvoje Benko所展示的Beamatron技术。他手拿一个像玩具汽车操纵杆的玩意儿,在地上控制一辆投影出来的虚拟汽车。汽车在现实中的房间地板上行驶,碰到斜坡或墙壁,还能自己上下坡和遇到碰撞时产生反应,和一辆真正的玩具车差不了多少。
它的实现原理和之前类似,可应用的场景严格来说归于“增强现实”类,实现了相当有趣的虚拟图层和现实的交互,并能根据指令产生不同的反馈。让虚拟的人或物在一片现实的障碍中穿行,这提供了很大的想象空间,不只是在未来的娱乐领域。比如,根据人在客厅里的行动,自动把他所收到的新邮件或者新短信放到他的视野范围内,这样就不会错过任何一个信息了。
几乎每一个技术都能引发无尽的想象。在一个角落的展台上,记者看到了一副真实的“机器人之眼”。它由两个Kinect所组成,模仿人的眼睛向外观察事物,并且远程连接到用户面前。你的面前会展现出机器眼睛所看到的场景,它是3D的,并且会随着你头的转动来调换场景。这可真是“足不出户知天下”了。
而在它不远处,有个名为IllumiShare的分享技术,很多人围绕在它周围。这是个看起来像台灯的装置,它提供了一个共享的方形平台,利用Kinect的捕捉能力,能让身处不同空间的两个人在同一个平台上画画或展示物品,效果相当惊人。据技术研究者、来自微软印度研究院的Sasa Junuzovic介绍,要实现这样的效果成本并不高,商用起来很方便。
这一切让人眼花缭乱。事实上现场还有很多很酷的技术,几乎所有最热的名词如增强现实、裸眼3D、动态捕捉、近场交互、实时翻译,都能在这里找到正在不断研究且进展很快的技术真身,比如当你口述一段中文,机器自动将它变成和你口音一模一样的意大利语;又或者你能用手指非常简单地取代鼠标,精确在空中完成对电脑的操作。
但其中最耀眼的明星仍是Kinect。这个已经在微软Xbox游戏机中得以商用的、价格低廉的装置正在引爆更大的想象空间,并激发了微软全球各个研究院中技术开发者们去以它为基础实现更深层、更具体的技术创新。记者询问了许多新技术的开始时间,它们很大一部分都是开始于近两三年内,那正是Kinect在游戏玩家中最初流行的时候。
其实,Kinect本身的实现原理并没有那么复杂,但它成功地用一种更自然的方式实现了对现实世界中尤其是人的动作捕捉。其意义在于,它让计算机有了更准确有效的“眼睛”去观察这个世界,并根据人的动作来完成各种指令。
方脑袋的机器人
“我觉得我们已经进入了这样一个时代:计算机渐渐拥有了能够与人类相媲美的能力——它们能看到、听到、触摸、感觉、了解我们所处的地点和感知运动状态。我们逐渐赋予了计算机这些能力,并用它开辟出巨大的用武之地。”里克说,“我们已经取得了不错的进展,比如Kinect这种相对廉价的装置,能看到你的运动并识别动作,并利用这些信息来控制用户界面。”
有意思的是,即便在技术研究界,大家也对Kinect如此管用感到很意外和惊讶,它开创了一个全新的研究领域,所有人都会想:“我们可以用Kinect来干点别的什么呢?”
而微软做的事情是顺水推舟。在不久之前,微软发布了Kinect的Windows SDK套件,允许全世界对此有兴趣的人基于Windows操作系统来挖掘Kinect的可能性,目前其下载量已经十分巨大。还记得Kinect刚发布时的标语,“身体就是控制器”,很多初创企业在这种新的人机交互方式中发现了蕴藏的机会。
微软研究院自己自然首当其冲。里克举了一个例子,当医生在做手术时,他很多时候需要查询关于病人的信息,比如在动作空间很小的血管手术里查看关键脉络,可他们因为卫生原因,又无法在手术状态下用任何触摸来完成信息的检索。而现在利用Kinect,医生完全可以实现这一点。
在人眼无法看到东西的暗处,Kinect也有妙用。它能通过红外摄像头“看到”事物,并且根据人的动作,经由不同声音的播放来对人进行提醒。这种方式对盲人格外有效。
在卡内基梅隆大学,人们正在用Kinect摄像头来控制机器人,让机器人自己独立走遍新落成的计算机系大楼。机器人能看到来往的人并及时避让,还会道歉。机器人会使用电梯——机器人不一定会操控电梯,但是它可以等候其他人到来,并请求别人帮助它进行相应的操作。据说这台机器人行动很快,不像传统大家看到的机器人那么缓缓挪动。
里克最近还看到一项演示,一家公司正在研究如何将Kinect摄像头用在超市购物车上,这样购物车就可以自动地跟随人们逛店购物。把商品放进购物车时,它会自动通过摄像头扫描,知道你所购买的是什么,并且在整个购物过程中提供协助。
Kinect与计算机的未来
正如无数科幻影片里所看到的,“机器人时代”正在到来,只不过它并非以拟人的方式存在,而是以计算机的形态出现在人们周围。它们通过摄像头来“看”,通过麦克风来“听”,一连串的语音分析技术和算法正在让它听得更智能;还有触摸和了解,微软等公司的大数据计算分析技术正在为“机器人”构建越来越智慧和丰富的“大脑”。
而Kinect正是让“机器人”的眼睛升级的过程,由此激发的各种应用场景下的创新,则是由眼睛连接到“大脑”并给予反馈的方式。
“这双眼睛”本身也在不断完善。微软亚洲研究院的赵春水和顾嘉唯为记者演示了“支持手势识别的下一代网络摄像头”,这简直就是一个活生生的最适合PC电脑场景下的宝贝。
与Kinect相比,它距离更近、实现更精确、视野更广,能够捕捉“双目”立体视频和高精度图像,比如人脸的细节甚至是指纹。这意味着什么?我们可以用比《少数派报告》中汤姆·克鲁斯更酷的方式来操控我们的信息,我们可以用更个性化的指纹或面部识别方式来管理我们的身份,甚至还有与过去“鼠标+键盘”时代完全不同的使用软件和互联网的方式。
未来,你很有可能只需要做一个打响指的动作就开启QQ,或者翘起大拇指来刷新微博。与很多行业应用相比,这股Kinect引发的创新潮流将会在未来10年对大众与社会产生深刻的影响。
“回头看70年前,有些体力劳动是非常艰难的。我看过一篇20世纪20年代的文章,当时的人们盼望着结束每天工作16小时的生活。人们的工作时间很长、强度很大,寿命却很短。”里克说,“现在人们有越来越多闲暇时间,能够以更高效率完成工作,并且还有更多自我实现的机会。我想如果没有计算机,很多事情不会如此变好。”
通过Kinect,我们看到了在人类改变世界中更大的可能性,与此同时,计算机逐渐可以被人以一种更加简单的方式去使用与控制。未来可能再也不用学输入法、编程甚至是外语,我们天生就可以和任何计算机、任何人对话,以我们最自然的方式。