用手机实现颇具创意的“增强现实版”的芬兰之旅
扫描二维码
随时随地手机看文章
第41届世界博览会上,芬兰馆利用诺基亚N900手机为游客们提供了一次颇具创意的“增强现实版”的芬兰之旅——当参观者将诺基亚N900的相机镜头对准场馆内的图标时,虚拟导游Aino就会在终端屏幕上出现。Aino会在镜头里为游客逐一介绍芬兰的著名风物,使游客宛如观看了一场神奇的“科技魔术”。
2 0 0 9 年11月,Yo uTu b e 上有一段T E D(Technology、Entertainment和Design三个单词的首字母缩写 )India的现场视频,这让一个名叫Pranav Mistry的年轻人引起了全世界的关注。早在2009年3月,Pranav Mistry在TED的一次年度会议上就已经展示了他的第六感(Sixth Sense)的发明,而且BBC和CNN稍后也对他的发明作了全方位的报道。但直到这次视频演示才让他和他的发明名声大噪。Pranav Mistry和他的第六感的发明为我们展示了一个充满科技感和梦幻感的现实世界和虚拟世界高度融合互动的未来。
Pranav Mistry 1981年出生在印度,年仅6岁时智商便已经高达176。他是麻省理工学院媒体实验室(MIT Media Lab)的博士候选人及研究助理,为穿戴式姿势感应界面的主要研发人员。在TEDIndia的演讲中,Pranav Mistry展示了他的很多发明,如可以将写在便利贴上的内容同步到计算机的数字便利贴上、画3D效果的笔、只需通过动作识别而不必输入关键词的实体世界的Google地图等。第六感的目的是为我们找到一扇沟通的门,可以在数字虚拟世界像在现实生活中一样进行沟通。从演示的效果来看,他的发明的确已经可以把人类的触觉和视觉扩展到虚拟的数字世界。Pranav Mistry在演讲中声称,“把资讯融入日常用品当中,不仅能消除我们与数字世界的隔阂和实体与虚拟之间的距离,就某方面而言,也会帮助我们保持原有的人性,与实体世界更加贴近,而且还可以帮助我们避免成为坐在机器面前的机器。”
1997年,北卡罗来纳大学的罗纳德(Ronald T. Azuma)在其论文《增强现实概览》(A Survey of Augmented Reality)中为增强现实提出了三方面的要求:现实与虚拟的结合、实时互动和三维注册。
所谓增强现实是一种结合虚拟化技术后观察世界的方式。它可以为我们提供现实中无法直接获知的信息,从更深层面上来看,种种信息实际上又让每个人眼中的世界更加多样。同一座大楼在我们每个个体的眼中会披上完全不同的“信息外套”,个体可以通过主观的意愿来让客观存在的大楼变成他所需要的“被信息化”后的实体大楼。
以新光天地为例,想要寻找美食的个体可以通过增强现实让新光天地变成只标注了餐馆信息的大楼;想要购物的个体同时可以把新光天地变成只标注了购物信息的大楼。三维注册(Registered in 3-D)是实现增强现实技术的关键环节,通俗来讲就是如何把需要信息化的现实环境与虚拟环境结合起来。
在那段仅长18分钟的视频里,P r a n a vMistry一步一步地为我们揭开了他是如何将现实环境与虚拟环境结合起来的。首先,他从机械鼠标内部的两个用来定位滚球活动的轴那里得到了灵感,把交叉的2个轴拓展到4个平行的轴,并固定在手背上。当手部有动作的时候,4个轴通过自身的转动来记录手部动作,并把这些记录的信息以计算机可以理解的方式反馈给计算机,并让计算机实时再现手部的动作,这就是比较简单的动作捕捉系统。有了机械的动作捕捉系统,我们的动作就变成了计算机可以理解的数字形式。
接下来,通过头戴式摄像机和缠上不同颜色胶带的手指,Pranav Mistry为我们展示了摄像机是如何通过颜色来区别并记录到每个手指的不同动作轨迹并能够在计算机内部再现的。
最后,通过记录手指在纸上不同动作的声音,Pranav Mistry把音频转换成数字让计算机了解手指的动作。不同的动作代表不同的需求,有的动作代表主体要观看视频,有的动作代表主体要进行视频游戏。结合前面摄像头的跟踪定位功能并通过头戴式投影设备,他实现了在一张白纸上观看电影《飞屋旅行记》和进行赛车游戏的演示。
通过展示,Pranav Mistry恰好为我们提供了基于硬件的、如何连接现实环境和虚拟环境的四种方式:机械式跟踪、光学式跟踪、超声波式跟踪和电磁式跟踪。也许随着人类科技水平的提高会出现新的方式,但就目前来说,这四种方式完全可以把人类的感觉和虚拟世界结合起来,科学家在论文中提到的增强现实已经不再是一个乌托邦式的梦想了。
目前,在社会生活中,增强现实技术已经运用到很多专业领域。例如利用病人的三维影像数据集,医生便可以结合病人的实体进行诊断和治疗;在复杂机械的装配、维护和维修上,通过悬浮在真实器械表面的3D虚拟指令,操作人员可以了解每一步该做什么和怎么做;当我们指向任何一个物体的时候都可以获得公共信息或者根据自己的要求得到某些私人的信息;在娱乐业中,色键(俗称蓝幕或绿幕)早已得到广泛的利用,它让演员在一块巨大的蓝色或者绿色的幕布空间内表演,通过后期制作把虚拟的布景和人物与演员的表演结合起来,这不仅可以有效降低成本,而且可以把虚拟世界和现实世界完美地结合在一起。去年的3D大作《阿凡达》所展现的3D虚拟世界和演员实体的融合与互动就是这一技术的最好展现。
在视频中,Pranav Mistry为我们展现的一切都让我们惊讶不已,但是这些都建立在他那一身可穿着的设备上—数据处理系统、摄像头、投影仪等。只有这些设备统统穿戴在个体身上,才能达到视频中所展示的效果。现在,增强现实技术在普通人日常生活中的应用正处在方兴未艾的阶段,而我们认为,在日常生活中的应用才是这一技术获得发展的最大动力。
在我们日常所使用的设备终端中,似乎只有智能手持设备可以最快达到实现增强现实技术所需要的基本要求:智能手持设备的后摄像头可以作为光学跟踪设备,麦克风可以作为音频跟踪设备,屏幕可以作为投影后的显示设备,操作系统可以作为程序运行的平台,而访问网络的能力可以访问远程主机,以作为数据库来使用。[!--empirenews.page--]
目前苹果公司推出的iPho n e和谷歌公司Android系统的手持设备都拥有了部分可以实现增强现实技术的应用。Layar公司开发了一款名为Reality Browser的应用早已登录了iPhone和Android平台,它的宣传语是:一款可以为你提供你所看不到的东西的、美丽而有趣的增强现实的应用 。
打开Reality Browser,将手机摄像头对准任何位置固定的物体,如建筑物、马路、桥、商店和景色等,就能在手机的屏幕上叠加出现与画面上物体(位置)相关的现实数据,如与你的相对距离,建筑物的介绍、周边的房屋出租、酒店介绍及价格等信息。不过这些由第三方提供的信息都不是直接全部显示在手机屏幕上的,而是有序地以Tag和Icon的形式叠加在屏幕上,用户感兴趣时可以点击Tag和Icon了解详情,也可以在设置时过滤掉你不喜欢的叠加信息。这里第三方信息的提供者就获得了赚取利润的机会,同时网络运营商也可以通过网络流量来营利。
Shazam是另外一款在iPhone和Android上都取得巨大成功的音乐识别应用。当你听到一段十分喜欢的音乐而又对这首音乐一无所知的时候,让Shazam听听你正在听的歌曲,然后它会把采集到的音乐样本送到数据库进行“搜索”,并把找到的结果反馈给你,除了音乐的专辑、艺术家、名称等详情之外,还提供Amzaon和YouTube的相关链接,方便你从Amazon购买、下载或登录YouTube观看视频。
运营商可以开发类似的音乐识别软件,提供目前国内受欢迎的“彩铃”下载和音乐专辑的购买信息,并以GPS导航的功能和前文提到的标记备注的方式展现在手持设备的屏幕上,这对于商家、运营商和消费者来说是一个三赢的局面。
增强现实技术民用的大门已经打开,手持移动设备的硬件配置飞速发展,网络运营商也已经商用了3G网络环境,我们有理由相信,增强现实也许有一天会比现实更加美好,也更加真实。