麻省理工新科技:不开口就能说话的耳机
扫描二维码
随时随地手机看文章
这样一个耳机,几乎是我们过去幻想中存在的东西,现在却离我们不再遥远。
不用开口就能互相交流,我相信你一定在一些小说或电影中看到过类似的桥段,最近,来自麻省理工的一个研究团队开发出了一项新的技术,让这种愿望得以成真。
这个被称为 AlterEgo 的装置由计算机和可穿戴设备两部分组成,计算机部分负责信息计算,而可穿戴部分负责信息采集以及传送。如你所见,和我们日常见到的可穿戴设备差别很大。虽说是原型机,但它看起来倒更像是用来矫正人脸部肌肉的仪器。
这个仪器实际上也有两部分,一部分是用于捕捉面部和下颌神经肌肉信号的传感器,通过贴合面部部位从而感知神经运动;另一部分是骨传导耳机,用于将信号处理结果反馈给佩戴者。
按照官方说法,研究人员发现,人的语言信号实际上是内部开始触发,也就是当你要张嘴说话之前,神经信号就已经出现,并到达下颌部位。这种人眼无法察觉到的信号是可以被捕捉到的,也因此,只要能让机器理解这种电信号的意义,它就会“理解”你说的话,按照这一思路,你就不难理解为何原型机这样设计。
虽然听上去不好理解,但只要看看它能做什么你就会知道有多神奇了。在研究人员设想中,这一设备是一种新的人机交流平台,可以让你在不开口说话的情况下进行三种操作。
第一种是物联网操控,比如你看电视或者听音乐时,只需要脑海中想要进行操作,就能不张嘴,直接控制这些操作,像换电视频道,切歌这些操作就非常简单,这时的 AlterEgo 相当于如今的智能音箱,当你不再需要张嘴就能控制家电了。
第二种功能是充当个人助理,语音助手出现这么多年,可我们还是不太习惯在公共场合唤醒并操控,但有了这个仪器,你只需要在心里默念一些任务,计算机就会“听懂”并告诉你结果,比如查询时间,或者询问天气,甚至于在超市买东西算总价,都可以直接心里默念,让 AlterEgo 的内置计算器告诉你结果,按照官方设想,这个不用开口的个人助理可以为你翻译,帮你搜索,查单词,进行运算,以及设定闹钟,你甚至可以在下棋时让计算机告诉你下一步要怎样走最合适。
第三种功能是社交。虽然听上去有点梦幻,但事实上,当身边的人都佩戴上 AlterEgo 设备时,不用开口就能听到对方想表达的东西也是可以实现的事情,这就相当于将原本要说的话直接传递到对方的耳机里,和第一种方式物联网的交流有点类似。
设想当中适合的场景很多
以上三种,都是借助于肌肉传递出的电信号,通过人工智能对于电信号的理解做出相应的判断,说到底,这和人工智能助手理解语音操作的逻辑类似,但却并不容易。
麻省理工学院媒体实验室(MIT Media Lab)学生 Arnav Kapur 表示这个原型最初目的是构建一个“IA 设备”,即“ intelligence-augmentaTIon”设备,正如它的英文名 AlterEgo 所代表的意义“另一个自己”一样,他们设想这一设备将来会成为人类真正的助手,或者用 Kapur 的话说,“在某些方面融合人与计算机,并让我们认知扩展。”
从现实意义出发,项目指导老师 PatTIe Maes 教授认为,随着当前人与智能手机越来越密切的关系,也带来了一定的破坏性。比如在人和人交流时一旦需要搜索某些结果或者查询信息,交流就会被手机强制打断,而新的交互体验无疑可以改变这种破坏性,它未必会替代手机,但它可以做的更好。
当然,从目前的研究来看,AlterEgo 也存在不小挑战,尽管自 19 世纪以来研究者就发现了身体语言表达和神经肌肉信号之间存在关联,但这种关联究竟怎样表达,如何能让计算机将神经肌肉信号转化成正确的语言,这些都是困难之处。即便目前,研究人员发现了下颌的特定位置具有可以传达电信号的能力,但要彻底将这种可能性放大到完全可用的情况,还需要很多努力。
另外,你可能会好奇设备的准确率,研究人员对 10 名测试者进行了 15 分钟的测试,让他们通过配搭设备计算数学题,发现经过 AlterEgo 的系统,目前在这项目上的准确度为 92%,这听上去是一个不错的消息。
而说到不用张嘴就能传递信号的其它运用方式,来自佐治亚理工学院的教授 Thad Starner 说,“比如在机场的停机坪上要控制飞机,那时候的巨大噪音通常无法用语音交流,想象一下在类似情况下,当周围环境是高噪声时,航空母舰、发电厂、印刷机等地方,这都是一个有意义的系统。”他还认为在一些身体有残疾的人群中,这个设备能帮助他们实现更好的生活。
尽管 AlterEgo 还处在原型阶段,外形也很夸张,不适合佩戴在公共场合。但这项研究无疑为我们展现了把人工智能技术的另一种用途,并尝试让人和机器进一步“融合”,当相关技术不断迭代并成熟时,相信终有一天,我们会看到令人大吃一惊的消费品。