语音识别技术给人们的生活带来了极大的便利性
扫描二维码
随时随地手机看文章
(文章来源:3D沙虫网)
你是否曾觉得你的语音助手——无论是Siri、Alexa还是谷歌——不理解你?你可以稍微慢一点、大声一点地重复你的问题,但最终你会得到你想要的信息,并以语音助手那种令人愉悦但毫无生气的语调读给你听。但是如果和你家里的技术人员交谈不是一个选择呢?这是美国300万口吃者中的许多人所面临的问题,另外还有成千上万的人不仅口吃,而且还有其他语言障碍,许多人感觉自己被忽视了。
来自洛杉矶的编剧杰奎琳·乔伊斯·里维尔(Jacquelyn Joyce Revere)说,“这些东西刚开始出现的时候,我很紧张。”“在洛杉矶,我随时都需要GPS,所以这似乎是一种更方便的方式来过我想要的生活。”里维尔说,自2011年以来,她一直尝试在iPhone和Apple Watch上使用Siri,并通过亚马逊的Fire Stick使用Alexa。尽管她继续尝试使用这些语音助手,但她的尝试经常让她失望。
里维尔说:“每次我尝试使用它,都是棺材上的又一颗钉子,再次提醒我这项技术不是为我量身定做的。”里维尔的挫折并不局限于语音助手。自动电话接口也会带来问题。例如,她说,她在电话上等上40分钟的情况并不少见,但当她接不出任何话时,接线员就会把电话挂断。
据口吃基金会主席简·弗雷泽说,电话接口多年来一直是口吃社区的一个常见问题。她说,口吃基金会收到了数百封寻求帮助解决口吃问题的电子邮件,而新技术已经以新的方式帮助老问题浮出水面。弗雷泽说:“总的来说,科技帮助了那些口吃的人,但当你试着告诉它你想要什么时,你会在电话里得到与机器或另一个人同样的体验——两者都挂掉了。”
不同类型的口吃会以不同的方式被语音助手听到。这些口吃的形式包括延长,声音被拉长;重复,当说话者重复声音或单词时;还有block(停顿),这是指当说话人说不出一个单词时所发生的停顿。弗雷泽说,有口吃障碍的人往往在语音助手和语音激活电话接口方面遇到最大的麻烦。
来自加州埃尔克格罗夫(Elk Grove)的律师助理泰勒·恩雅特(Tayler Enyart)是Alexa和Siri的另一名用户,他会在几个街区里口吃。与里维尔类似,她在使用这项技术时也遇到了麻烦,并因此感到被忽视。“使用这些技术对我来说并不容易,”Enyart说。“我都试过了,但它们都把我拒之门外。这真的很令人沮丧,所以我尽量避开它们。”我的一部分感觉真的被遗忘了,但另一部分就像,‘我已经习惯了。’”
苹果、亚马逊和谷歌都有自己的方式为口吃或其他语言障碍的人提供可访问性。亚马逊和苹果已经发布了允许用户向Alexa或Siri输入命令的功能,比如在Echo Show中点击Alexa,或在2018年的iOS 11中输入Siri。
谷歌不断更新它的谷歌助手与新的语音样本,以更好地了解口音或语音不流畅的人。2019年,该公司宣布了一个名为“幼发拉底河项目”(project Euphonia)的研究项目,其目标是最终创建一个识别模型,能够在所有计算机平台上理解有语言障碍的人。这个项目的灵感来自于肌萎缩性脊髓侧索硬化症患者,目的是收集足够的音频样本,创建一个可以预测和理解受损语音模式的声音模型。
根据Brenner的说法,大幼发拉底河项目最大的挑战是缺乏数据。因为语音识别技术是用来听标准语音的,所以Euphonia项目需要受损语音的音频样本来训练计算机也能理解它。理想情况下,“幼发拉底河工程”将能够获得数千万个音频样本,从而建立一个统计模型,能够预测和理解受损语音的声音,但这是一个不可能的标准。
“我们不想过度承诺,因为我们不知道什么是可能的,但我们想帮助人们,”布伦纳说。“理想的情况是有足够的样本来建立一个通用模型,但我们没有。我们想知道如何利用我们的演讲做一些有用的事情。”嘿,谷歌,Siri或Alexa:哪个语音助手处理这100个问题最好?瑞特说:“我希望我们正在创造的这种技术能够帮助教育slp患者和口吃者,而不是仅仅帮助50个人(通过传统疗法)。”“对于那1%的口吃者来说,能达到1000人是上天的恩赐。”
尽管人们努力提供帮助,语音助手对许多口吃者来说仍然是遥不可及的。汉娜·阿诺德(Hannah Arnold)是来自华盛顿州肯特(Kent)的牙科接待员,她在2013年首次尝试使用Siri和Alexa。她的第一次尝试有点紧张,因为她不确定机器会如何回应她的口吃。“我有Ws问题。我得花点时间才能说出来,”阿诺德说。“所以当我想说,‘嘿,Siri,今天的天气会怎么样?’的时候,Siri总是会打断我。”
如今,阿诺德很少使用语音助手,但她知道如何让她的生活更美好。例如,她不必在她的Apple Watch屏幕上打字,也不必在车里问路,她可以直接问Siri。“这相当困难,因为我觉得语音识别——以及与其他技术对话——正在扩大,”阿诺德说。“但随着新技术的进步,我希望我们会有更多的调整。”