AI辅助人的视觉需要跨过多少坎
扫描二维码
随时随地手机看文章
2007年7月,林宥嘉以大学生的身份站上了《超级星光大道》第一季的踢馆赛,翻唱了一首歌曲,从此为人所熟知。
这首歌就是被传唱一时的《你是我的眼》,原唱者萧煌奇是一一位视障人士,失明的人生中,他一直保持乐观态度,热爱音乐与创作,一首以自己为原型的《你是我的眼》横空出世,给所有黑暗中的视障人士带来了鼓励与温暖。
但是你能想象吗?有一天,视障人士可能会深情款款地对AI唱起“你是我的眼/带我领略四季的变化/你是我的眼/带我阅读浩瀚的书海……”
当AI要承担起“眼睛”这个角色时,要如何才能将这个世界带到视障人士的面前呢?利用高科技来“作眼”,又是否切合了视障人士的真正需求?
从感知到“看见”:层出不穷的“助视”产品
不得不说,巨头们在推进前沿技术的同时,一直没有忘记对视障这一弱势群体的关怀。一大批助力视障患者的产品和技术如雨后春笋般涌现,这些产品里流露的温情不仅体现了企业对视障群体的关怀,也是对科技巨头最好的品牌广告。
智能相对论(aixdlun)分析师颜璇梳理了各类与视障有关的智能产品,大致将其分为三种类型:
1、曲线救国型:还记得我们一直拿来做作文论据的海伦凯勒吗?海伦·凯勒的老师在教她认“water”时,让她伸出一只手去感知水的流动,并在海伦的另一只手上拼写了这个单词。从这里我们可以看出,目不能视的视障患者认知外界世界的渠道是除了视觉之外的其它感官感觉,比如听觉、嗅觉和触觉。
基于此,慕尼黑公司和韩国公司联合完成了一款专供盲人使用的盲文智能手表(Dot Watch),搭载了盲文显示系统,以盲文的形式将各种信息呈现在手表的触摸表盘里。
相机也给出了触摸形式。美国一位设计师专门为视障人士设计了一款to see 3D相机,这款相机能通过镜头实时地将拍摄的物体转化成三维触感数据,使视障人士通过触摸屏幕表面生成的立体形状来识别面部细节,比如读取表情等。
当然了,除了触觉,听觉的更不会少。IBM 推出了无障碍环境的一项发明——专为盲人设计的新型导航 APP NavCog.NavCog 可通过耳机与智障人士“耳语”,帮助人实时识别位置、朝向,还能辨认迎面走来的熟人。
2、外力加持型:这种类型的载体一般是智能眼睛,主要是为弱视群体(即视力不到常人的 60%)打造。
比如一款名为eSight的产品,结合算法和部分盲人自身的需要,通过控制器中的液体镜头技术进行“聚焦”,弱视者可以利用眼镜中的 Bioptic 倾斜功能,不仅可以调整瞳孔距离(对焦),还可以调整图像的清晰度(颜色、对比度、亮度),从而“重获光明”。
3、直截了当型:视觉的产生依赖于三大组织器官:眼球(主要为视网膜)、视神经、视皮层。对于视障患者而言,如果想要“一了百了”,恢复视觉,就必须研发出能替代这三种组织的假体,即视网膜假体、视神经假体和视皮层假体。
国内就有研究团队制作出了人造视网膜,其由体内电子微系统和体外电子系统两部分组成。使用方法是在患者眼球内部植入IC芯片,用来接收信息和传导电信号。然后再为盲人配备一个体外接收系统,比如眼镜。
“眼前的黑不是黑,你说的白是什么白”
即使现在的智能“助视”产品比比皆是,但要真的掀开视障患者眼前的帘子,恐怕还不容易。
人造视网膜技术具有很强的综合性和复杂性,需要机器视觉、IC设计、半导体工艺、纳米技术、神经科学、生物材料等十多个学科的科学家和工程师全力投入,密切配合,缺一不可。但即便拥有如此高精度团队,外界信息通过电信号传递到大脑中,盲人感受到的也不过是一个灰度的、马赛克的世界。
即使是黑白的“渣像素”,也能勉强算“看见”了。而不能算“看见”的那些智能产品,比如智能眼镜、认知助手等,仅仅只能提供语音让患者接收到相应信息。患者能做的就是,在“助手”说前面有障碍物请绕过去时无奈绕开,而不能亲眼看看阻拦自己的障碍物究竟是一个石头还是一辆单车。
当我们不断加大视障患者在其它感官上接受的信息量时,也会带来不小的后患。比如,从听觉入手的产品往往会让使用者戴上耳机,这就会让盲人与周遭的声音隔绝,出行在外容易造成危险,而不带上耳机进行电子播报,容易造成患者的信息外泄。
我们将智能产品应用在视障患者身上时,除了要为他们带来生活上的方便,更是想让他们看到这个美丽的世界,无障碍地探索这个世界。当我们用一种以其它感官来辅助视觉的技术思路来实现客观上的无障碍的时候,肯定会与视障患者主观上的无障碍有区别。就正好应了那句歌词,“眼前的黑不是黑,你说的白是什么白”。
即使是弱势群体的智能眼镜,戴久了人们或多或少都会产生不适感。想想我们在电影院看3D电影的时候,3D眼镜也曾让我们头晕目眩,沉浸式技术也极容易带来头晕、恶心等反应。除此之外,戴智能眼镜限制了侧面周边的视觉范围,视障患者要做到和正常人一样的移动和工作还是不易。
要真正的为视障人士带来便利,这些智能“助视”产品必须要解决它成本太高,价格太贵的问题。由于致盲因素不同,很多盲人需要高度个性化定制的智能产品,这更加导致成本居高不下。比如加拿大一家医疗科技公司OcumenTIcs在去年开发的仿生镜片也只适合25岁以上的成年人。
看得见,以看懂表情为标准
归根究底,不管智能产品有多炫目,对盲人而言,他们更在乎智能产品的实用性,而真正实用的产品于他们而言就是三个字——看得见。
仿生眼球当然具有很大的市场,但这种疗法并不适用于所有眼科疾病。智能眼镜+芯片的组合则是可以通用的,因为其视觉计算能力,人脸识别等功能可以接收外界信息,芯片通过柔性电极阵列来传输电信号,刺激视网膜的神经细胞,进而传递到大脑中,让盲人看见黑白的影像。
但对于市场来说,通用的就不具有特殊性了,所以,谁能快速抓住“通用”中的亮点以及最不易解决的问题,谁就能在“助视”这方面成为佼佼者。
神经科学家认为“人脸识别”有两个方面,其一是特征识别,也是目前的智能眼镜配备的识别类型。其二是表情识别。事实上,经过了亿万年的进化,人类形成了六七种与情绪密切相关的基本表情,它们是:快乐、惊奇、悲伤、愤怒、厌恶、轻视和恐惧。这些基本表情是人的本能,不需要学习就与生俱来。
目前,我们对脸部特征与表情之间的区别还不太清楚。在我们看到一个人时,我们大脑里的人脸识别机制就会开始运作,我们会在一瞬间就判断处这一张脸是不是熟面孔以及这个人的表情如何。但这一瞬间,对于视障患者却难如登天。
所以,让AI来帮助盲人看到人的表情或许是智能“助视”在人脸识别上的真正战场。这一举动的意义不止在于需要AI去识别更细微的脸部特征,还在于要为盲人获得更加清晰的图案,而不是模糊的一个影像。
英国《柳叶刀·全球卫生》有一份研究报告预计,当下,全球盲人数量为3600万,如果不加强对眼疾的治疗,到2050年将增至1.15亿。这是一个足够惊人的数据,而借助技术的力量,我们希望,每一个在生活中艰难独行的盲人,不论他们的年龄大小、环境状况如何、贫穷或富有,他们都有和明眼人一样看美丽世界的权利。
智能相对论:深挖人工智能这口井,评出咸淡,讲出黑白,道出vb深浅。重点关注领域:AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。