看电视?其实电视也想看你!
扫描二维码
随时随地手机看文章
简单来说,“谁在看谁”的概念已经出现反转。在嵌入式视觉的世界,关键主体不是想拍出更加照片的你或是摄影师们,为嵌入式系统而开发的技术要“看”的对象是你、它们要识别你是谁、分析你的行为,然后处理那些它们认为你会需要的资料。
可能在你的认知里,这些技术就是“机器视觉”或是“计算机视觉”;也许没错,但坦白说,目前有一些利用嵌入式视觉技术来执行的市场行销策略,令人颇感不安。当然,这类市场营销手法不至于像是美国国家安全局(NSA)的电子监听那么恐怖,但该种技术基本上就是有一堆传感器在监视我,目标就是要赚我的钱──这实在 让我觉得毛骨悚然。
我最近在日本东京与一家美国嵌入式视觉技术开发商CogniVue 的业务发展副总裁Tom Wilson见面;他告诉我,像CogniVue那样的视觉处理技术开发业者,目标市场不会只是汽车应用。以下是Wilson所分享的几个嵌入式视觉技术应用案例:
●当驾驶人在黑暗荒凉的道路上开车,(平常是关闭的)路灯会在汽车行进到前方时开启,当它们感应到汽车已经离开就会再度关闭。
●当你从一个数字看板──也就是公共场所的大型电子显示器──前方走过,那个屏幕甚至会在你注意到它之前,就可以辨别出你的性别与年龄,然后快速变换所显示的广告消息,以迎合你所属的人口族群喜好、吸引你的目光。
●智能手机可识别你的手势,或者是支持人脸识别协助你标记影像(通知你那个你正在看的人是谁、或是你所拍的照片里有那些人,还会上传到社群网站)。
●有一双“眼睛”的机顶盒,会观察你家客厅、识别出谁在看哪些电视节目,然后将那些信息传送到后端服务器,在你正在看的节目里置入你会有兴趣的数字产品广告。
在以上几个案例里面,最吸引我注意的就是最后那种“有眼睛的机顶盒”;当然,因为知道微软(Microsoft) Xbox 360游戏机的体感识别装置 Kinect ,这种技术或许不那么令人惊讶,但我就是很想进一步了解它的运作原理。
对此Wilson的解释是:“那就是说,如果你正在看美剧《Friends》,那台机顶盒会知道是你在看,然后知道你喜欢的是可口可乐而不是百事可乐。”于是后端的服务器能以数字化的方式,把影集中人物正在使用的植入性营销产品,换成你喜欢的那种。
Wilson 指出,有一家广告平台开发商Mirriad,就是专门提供这样的解决方案:“他们的方案就是将置入性广告类型与观众的喜好搭配。”根据他的说法,该种“有 眼睛的机顶盒”并不是一个牵强的概念,Mirriad这家公司最近已经与机顶盒供货商Pace签署合作协议,要在英国试用这种解决方案。
在解释何谓数字广告植入性营销方案时,Wilson开玩笑地表示,这就是他家没有电视的原因之一;但他也让我理解了那些嵌入式视觉应用带来的深远影响,以及嵌入式视觉IP (包括软件与硬件)供货商之间的竞争,在近几年来有越演越烈的趋势。
CogniVue、 Mobileye、 CEVA 与 Tensilica (现已收归Cadence 旗下)是目前市场上可提供嵌入式视觉技术的几家IP供货商,Imagination Technology 最近也藉由发表PowerVR Raptor ISP (image signal processing,影像信号处理)技术成为该领域的新竞争者。
其它芯片大厂包括Freescale、TI与ST也有推出特殊应用视觉处理器产品,但通常是与业界伙伴合作,或是与嵌入式视觉IP供货商签属授权协议。
目 前汽车应用是各种视觉处理器的主战场,因为嵌入式视觉在先进驾驶人辅助系统(ADAS)内扮演要角;汽车厂商正指望ADAS带来新商机,大力宣传该系统可 提供的各种安全功能如车道偏离警告、撞击缓解(collision mitigation)、自动停车,以及盲点提醒等等。
根据市场研究机构IHS的估计,特殊应用视觉处理器在汽车市场的应用规模,2013年可达到1.51亿美元;该数字在 2012年为1.37亿美元,在2011年则为1.26亿美元。
仍有待克服的市场障碍
不过目前产业界其实仍只看到嵌入式视觉的表面;如嵌入式视觉联盟(Embedded Vision Alliance)创办人Jeff Bier先前接受EETimes 美国版访问时所言:“视觉处理仍有许多非常困难的问题有待解决,就算人们花费大量的时间开发了一系列嵌入式视觉算法。”
CogniVue 的Wilson也同意以上看法,他指出,要处理大量的实时数据需要非常密集的运算性能,而要以一个强健的方式架构出“3D传感器映像图(3D sensor map)”,特别是在诉求低功耗的消费性电子装置中,更是艰难任务。Wilson解释,所谓的”3D传感器映像图”是解决目前2D计算机视觉基本限制的关键。
举例来说,2D技术在影像分割(segmentation,也就是分开背景与前景)、照度(illumination, 支持人脸识别)、相对定位(relative position,辨别画面中物体相对位置),以及遮蔽(occlusion,识别人脸前方的手)等方面有问题,而不同3D感测方案都面临性能上的折衷。 Wilson表示,CogniVue现在正试图透过算法解决映像图问题,以催生低成本3D传感器视觉方案。
对系统设计工程师来说,要设计出能有效执行不同视觉算法的硬件,是很大的挑战;那些正在寻找影像/视频处理解决方案的系统供货商,可选择把所有任务留在CPU里面、将影像任务交给GPU,或是添加专门处理影像的硬件逻辑。
随着像Imagination这样的主流GPU核心供货商涉足视觉市场,可预见相关IP供货商与芯片厂商的竞争将更加激烈。而我们也可以预期,未来将会有各种各样让人惊艳的嵌入式视觉解决方案出现在日常生活中…拭目以待那个“美丽新世界“吧!