siri为何没有给语音识别技术应用带个好头?
扫描二维码
随时随地手机看文章
语音识别 (voice recognition)是多次被热烈期待、又让人大失所望的技术之一;寻找一种实用的人类语音识别技术之需求,自该技术首次被尝试运用在人机界面以来,一直都是个挑战。
最新一代的消费者导向人机界面技术Siri,是苹果的iOS操作系统所配备之智能个人助理与知识导航应用程序;该技术是由Siri这家公司的共同创办人与前任CEO Dag Kittlaus出售给Apple。根据Apple说法,该软件会随着时间适应用户喜好、产生个人化的结果,也能执行查询附近餐馆、指引方向等基本任务。
Kittlaus表示, Siri是起源于一个由美国国防部高等研究计划署(DRAPA)所赞助、在研究机构SRI International进行的一项“2.5亿美元专案”;而Siri的诞生其实是众多研发人员的共同成果,他们来自卡内基美隆大学(Carnegie Mellon University)、麻州大学阿默斯特分校(the University of Massachusetts Amherst)、罗彻斯特大学(University of Rochester)、奥勒冈州立大学的人机认知研究中心(the Institute for Human and Machine Cognition)、南加大(the University of Southern California)以及史丹佛大学(Stanford University)。
Siri 共同创办人Dag Kittlaus (照片提供:Northwestern University)
Apple将Siri纳为旗下应用程序之一,并用于其iPhone 4S智能手机。Siri能让用户以语音发送信息、安排行程、拨打电话、下指令、问问题,而且能理解自然语言;Siri也会在需要更多资讯来完成任务时,主动提出问题。
有鉴于此,其实那些任务都是被明确定义与限制的,而语音识别技术都是依照设计来运作。而这也是语音识别技术发展历史上的一大难题,该种应用程序需要被限制在某个范围内、聚焦特定的任务,并被放在一个封闭的生态系统里,于是用户才能在iPhone 4S上收到一小部分令人满意的结果。
语音合成以及语音识别应用程序在今日普遍可见,应用范围涵盖电话查询飞机航班、车用语音导航系统、盲人电脑以及安全系统等等。在年度的“5 5预言”科技发展预测中,IBM院士语音技术官David Nahamoo认为,生物识别(biometrics)将因为整合语音识别技术以及其他生物识别技术,更充分发挥其性能。
“接下来五年,个人的独特生物特征与生物识别数据──例如脸部特征、虹膜扫描资料、语音档案甚至DNA──将成为保护个人身分与信息的关键,并取代目前的用户帐号/密码系统。”Nahamoo表示:“我们可利用已经内建于今日智能设备的先进技术,例如麦克风、触控屏幕、高分辨率摄影机等,来完整布署生物识别安全功能选项。”
IBM的研究人员在近几年公布的“5 5预言”中,列出了将持续突破人类极限、强化并扩大我们的感官能力之新兴技术;那些技术包括机器学习(machine learning)、人工智能(artificial intelligence)以及先进语音识别技术。
因此,尽管连续性的语音识别技术目标仍然像50年前一样难以捉摸,现在毕竟已经有了被定义在有限范围、可以放进口袋的应用程序,让实用的语音识别技术成为可能。