信息无障碍 CTI服务残障人
扫描二维码
随时随地手机看文章
公元2008,奥运之年。今年“5·17”世界电信日的主题已确定,“让信息通信技术惠及残疾人”。今年工信部把行风建设的主题确定为“通信服务与社会责任”。
主办奥运会的北京市把市政和建筑物的无障碍建设推到了一个新的水平。
为了支持同年将举办残奥会,歌星刘德华自费、自词、自唱了奥运歌曲《Everyone Is NO.1》,中国移动提供无线音乐平台供人们无线下载,下载热浪空前。
所有这一切都无不警世人们:关注残疾人事业。在这个不平凡的年代,我们不禁要问自己:作为IT业者,我们为残障人事业做了什么?做得怎么样?将来我们究竟可以做到哪一步?
残障人信息无障碍 --- 本世纪的伟大理想
残障人的残障分为肢体障碍、智力障碍和感官障碍。肢体障碍使人的行动不便,而行动的无障碍设计包括从坡道、厕所、拐杖、轮椅,一直到最高级的可以与人的神经系统相连的智能假肢等等一系列硬件产品和设施。对智障的关爱,需要健康人和残障人之间进行大量的接触和交流。
感官障碍主要指听说障碍和视觉障碍。
我们知道人获取信息一个靠听,一个靠看,所以聪和明是人丰富知识、发展智力和与社会互动的必要条件。
随着电脑、电信和互联网的飞速发展,由于经济条件和受教育条件的不同,社会的差距也在迅速扩大。谁占有丰富的信息,谁的生活和工作效率就会更高,创造财富的能力就越强,这种现象无论在个人,还是在企业,甚至在国家身上都存在,就是说信息已经成为产生社会差距和不和谐现象的加速力。
社会信息化对于健康人造成的压力况且如此,那么对于有感官障碍的人群受到的压力更可想而知了,这种压力比以往任何时代都大,甚至有一点点残酷。往往感官障碍者的智商一般还比较高,他们对信息的渴望往往比健康人还强烈。感触到信息洪流的脉动却无法获得,这种孤独和被边缘化的感觉甚于以前的时代,言其残酷丝毫不过分。
上面我们分析了,智障主要靠家庭成员和社会工作者与之进行耐心接触来激发其智商、情商的潜质;肢体障碍主要靠高质量的硬件产品来辅助实现无障碍。肢体残障的无障碍产品的历史比较悠久,发展亦成熟,唯有感官残障的无障碍技术发展最慢,基本停留在哑语和盲文的水平上,因此人的感官障碍已经成为残酷的信息障碍。信息快速发展和信息障碍的存在形成了巨大的反差,严重影响了残障人享有信息的权益。
北京捷通华声语音技术公司致力于人机交互(HCI)技术的研发,一直积极支持残障人事业,譬如用手写识别技术支持聋哑人的信息交流,用语音识别和语音合成帮助盲人使用电脑.捷通华声在2000年、2003年几次荣获北京市和广州市残联的支持残障人事业奖项,直到2007年2月,捷通华声的“盲人手机导航”项目荣获了美国高通公司BREW“无线关爱”应用基金的支持,捷通华声支持残障人事业开始了新的篇章。
捷通华声公司《盲人手机导航》项目凭借其嵌入式语音技术,创新并充分体现人文关怀的产品设计,在激烈的竞争评选中脱颖而出,数以百计的参选方案中全球仅有5家科技企业获此殊荣。
捷通华声《盲人手机导航》全面应用捷通华声具有自主知识产权的嵌入式语音合成与语音识别技术,在产品设计中打破手机传统的使用方式,使其具备能“说”会“听”的智能交互功能,从而使得视觉障碍者希望利用移动通讯设备实现获取更多信息的梦想成为可能。《盲人手机导航》通过语音识别技术,让手机“听懂”人的声音指令,应用语音合成技术将文本信息“朗读”出来,帮助视觉障碍者将平时人们习惯的“看”短信、“看”来电号码、“看”时间等转变为“听”短信、“听”来电号码、“听”时间等功能,手机中天气预报、语音词典、信息查询、日程安排等功能也都可以通过声音交互而完成,从而使视觉障碍者也分享到移动通讯带给人类的便利,共同享受工作与生活的乐趣。
捷通华声《盲人手机导航》是实现“信息无障碍”的一次成功尝试,捷通华声还将为此继续努力。
CTI 服务残障人 --- “C”的任务大于“T”
在上个世纪90年代初期,CTI还只是通信科学领域的一个技术名词,具体地讲,在计算机主板的PCI插槽插上语音卡同电话网相连,以语音卡识别电信的音频码,接受客户的服务要求,回答客户时把文本的内容通过TTS处理合成出来人的声音用电话播讲,这就是CTI基本应用,即所谓计算机与通信的融合。
CTI在中国的特快发展始于本世纪初,它与中国现代服务业、电信业和IT业的快速相伴随,从7x24小时电话银行到彩信、彩玲,CTI已经深深影响了人们的生活。随着数字化高清晰电视和3G的实现,CTI必将有激动人心的发展。
面对如此丰富多彩的盛宴,我们同样想到一个问题,我们能够安心享用CTI而忘记残障弟兄姐妹吗?
捷通华声的HCI技术发展于支持残障人事业的终极目标是彻底实现聋哑人和盲人的信息交流无障碍,譬如健康人可以通过ASR语音识别跟聋哑人说话,聋哑人用读手机屏幕和手写实现听和说;盲人可以用口述方式实现信息检索,用耳朵听取信息检索的结果。
坦率地说,真正意义上的信息无障还是比较困难的。
因为计算机发展今天,虽然它的速度已经很快,但是其智商并不高。如今世界上最先进的计算机,可以战胜国际象棋大师的计算机,其智商也只相当于一只蜥蜴,我们平时使用的计算机的智商只在昆虫的水平。计算机是基于0和1这两个最简单数字来实现高速度精确计算的,而人类一开始学习知识就具有排除具体差异干扰,建立概念,具备容错和模糊的能力。
我们假设大家可以像播音员一样标准地讲话,即便如此,这里依然存在着几种模糊,如:语音模糊,音词转换模糊,指代性模糊,多义模糊和语义切分模糊等等,况且我们平时讲话不可能没有说错的时候,诸如咬字不清、用错词汇、习惯性的口头语、重复、省略、补充、纠正插入、发音错误、不规范的语法等等,人类在会话中可以“谅解”这些错误,一般不影响理解。可是综合所有这些因素将使计算机语音识别的计算变得一塌糊涂。[!--empirenews.page--]
尽管困难,但是对于人机交互(HCI),尤其是基于汉语的HCI,中国的科学家一直没有停止努力。中科院声学所黄曾阳研究员提出了基于自然语言理解的"概念层次网络理论",即HNC理论(HNC即Hierarchical Network of Concepts 的缩写)。这个理论一出现,立刻在我国计算语言界引起了广泛的重视和认同,一些著名学者称随着这一理论在计算机上逐步实践,计算机自然语言理解上将获得突破。现在HNC在我国已经成为一门独立的学科,很多大学和科研机构专门研究它。中国科学家把HNC认定为本世纪一定要攻克的任务。
根据这个理论,我国科学家在计算机上设计了一套计算机可读的符号系统,建立了富有汉语特色的知识库,知识库中包含了内容极其丰富、内在逻辑关系十分严密的网络结构语义信息。
有了HNC,当电脑“听”到第一二句话的时候,系统会马上建立可能的语境,揭示会话的隐藏知识,在处理语言细节方面还有单字词感知、语义块感知、句类判定等处理模块。有了HNC这几个模块的处理,语音识别就可以识破语言中丢词、错词、语序错、语法错等造成的陷阱,在语音信号方面,系统依据知识库来弥补语音信号的缺失和变形,计算的效率和准确性将大大提高。
所以我们说说HNC的成功之日才是真正的信息无障之时。
无障碍 —— 不仅仅为了残障人
毋庸置疑因为残障人毕竟属于少数人群,残障人的支付能力,产品研发的投入与产出都将困扰“信息无障碍”事业的发展。
不过我们发现了几点理由证明“信息无障碍”事业不仅仅是为了残障人,也是为了我们自己。
这个理由还不包括因为“天有不测”,健康人在不测之日变成残障人之类的命运话题。
理由一:“信息无障碍”可以助力我们迎接老龄化社会
人是要老的,现代社会已经加快了老龄化步伐。就像人终究需要一根拐杖或者轮椅一样,多数人老了之后将被视力障碍和听力障碍所困扰。那么如果有了语音识别和语音合成的助力,老人与社会的沟通就会变得方便,老人就少了孤独的感觉。
社会老龄化加剧,社会服务老人的总成本无疑会增加,怎样实现既要保证老人们生活水平不下降,得到社会关爱,又有效控制总成本呢?服务老年人群的、智能的IVR中心将扮演越来越重要的角色。以老人为服务对象的IVR中心,将能够和老人聊天,响应他们的服务需求,解决他们的问题。
今天我们为智能的IVR技术而奋斗,说不定将来我们就是这个IVR的受益人。
理由二:“信息无障碍”可以助力我们实现人的平等和社会和谐
现代社会似乎有这样一种潜规则:
你要获得更高的社会地位吗?读书吧,你获得的知识越多,学位越高,你的社会地位将更高;
你想获得更多的信息吗?读书吧,你具备的知识越多,更多的信息对于你才有用,不然信息之海对于你不过是过眼的烟云,不知其所云;
你想获得最终的学历吗?读书吧,不管有用没有用你必须沿着这个台阶走下去。
有的时候,你只想弄清一个简单问题,为此你也许要读上一大本书,为了找到那一页,也许你要读上200页。
因此我们的社会对于爱读书大加歌颂,勤奋和精力充沛的人成了佼佼者,尽管这绝对正确,无可厚非,但是社会也因此失去和谐,差距因此扩大。
美国加利福尼亚大学的威廉-克劳斯曼教授发现了这个问题,他大胆预言2050年世界将从“印刷文化”向“口语文化”回归!人类最早的知识就是口口相传的,可是后来知识越来越多,不得不借助于文字。随着文字越发地高深浩瀚,被社会边缘化的人群越多。所以这种回归非常必要,因为大多数人在大多数情况下需要的是结论而不是推理。
这种回归就是我们为之奋斗的“信息无障碍”,它的最直接的技术就是语音识别与语音合成,当然它的下边还有知识的分类和互联网作支撑。
科学技术将第一次直接助力和谐社会的建立。
社会将有那么一天,无论是健康人还残障人,以什么方式都可以获得知识和信息;无论是青壮年人还是老人或孩子,它们都可以享受社会同样的服务,而远离孤独;也无论学历高低,甚至文盲,在获取需要的知识上将没有不同。平等和和谐由此而生。
“信息无障碍”,为此奋斗不会错。