智能语音开启方言模式,科大讯飞人工智能步上新台阶
扫描二维码
随时随地手机看文章
科大讯飞头顶“AI龙头”的光环,作为A股第一家以人工智能为主业上市的公司,一举一动备受瞩目。从概念到技术,从技术到生意,“会不会做生意”成为讯飞的重头戏。
以日新月异的智能语音技术而蜚声世界的科大讯飞,近日入选我国首批国家新一代人工智能开放创新平台依托企业。科大讯飞的语音识别技术研究,既注重全球视野,又不忘民族特色,尤其在中国方言识别领域一马当先,成就卓著。
近日,在科技部召开的新一代人工智能发展规划暨重大科技项目启动会上,我国首批国家新一代人工智能开放创新平台名单正式公布。该名单包括四大平台,对应四个依托企业,除了“BAT”三巨头之外,科大讯飞也荣膺在列。
科大讯飞以日新月异的智能语音技术蜚声世界,此次成为智能语音国家新一代人工智能开放创新平台的依托企业可谓实至名归。除了在英文、普通话、医疗影像等的机器识别领域走在前面,科大讯飞的技术还别有过人之处,这就是方言语音识别。
长期以来,推广普通话与保护方言之间存在一些难以避免的矛盾。总体而言,近年来普通话的普及程度越来越高,而不少方言由于使用机会越来越少而逐渐式微。尤其是在普通话基础教育环境下成长起来的新一代年轻人,很多都对当地方言听得懂却说不出,或者既听不懂也不会说。
近几年,市场上出现了不少面向汉语的语音识别、语音输入智能软件,它们绝大多数都只适用于普通话,其中一部分还可识别粤语、上海话等方言,不过种类非常有限。这对大批不擅长甚至不会说普通话的国人来说,无异于先天性地丧失了使用权。同时,普通话在智能语音领域的“垄断”也让人们又一次失去使用方言的机会。而方言衰落乃至灭绝给民族传统、文化传承造成的损失难以估量,无论是文艺界还是科技界,这都不是人们愿意看到的。
出于满足用户个性化需求和保护方言的双重使命,科大讯飞开始了用人工智能表达乡音的尝试。2014年年初,在云计算、大数据、深度神经网络、方言口音适配等技术的综合作用下,四川话成为率先应用于科大讯飞输入法的方言(不过在此之前,讯飞输入法已支持粤语输入)。此后,科大讯飞在中国方言语音识别技术方面突飞猛进,至2017年11月,科大讯飞能够识别的方言种类已达22种,识别准确率超过90%者有十余种,对中文的识别准确率已超过英语。
在今年10月24日举办的开发者节上,科大讯飞宣布重磅消息,启动了以“留下你的乡音”为口号的“方言保护计划”。到2018年年初,科大讯飞计划收集1024万条来自各地的方言,力邀全民参与共建“中华方言库”。技术攻坚与公益事业合二为一,相辅相成,创造了科技进步促进文化传承的典范。
据了解,我国目前日常使用的方言有80多种,要实现对这些方言的机器识别乃至推出产品应用,无疑还有很长的路要走,但科大讯飞已然一马当先。在众多语言学家与技术精英的通力合作下,方言保护事业将越做越顺。
科大讯飞的语音识别技术研究,既注重全球视野,又不忘民族特色,一方面是中译英、中译韩、中译日、英译日的接连突破,另一方面则是粤语、四川话、闽南语、客家语、贵州话的不断拓展。国际化与民族化兼顾,这正是一个国家级人工智能开放创新平台依托企业应有的气魄。