一家独大到三足鼎立,智能语音发展格局悄悄改变
扫描二维码
随时随地手机看文章
12月初发布的《2017-2018中国智能语音产业白皮书》显示,2014年至2018年,中国智能语音产业规模由30亿元增长至159.7亿元,增速高达530%。虽然,科大讯飞和百度分别以44.20%和27.80%占据市场份额前两位,但仍在这一不断极速扩张的浪潮中不断迎来新晋者的挑战,而产业格局也正在悄悄发生变化,向更多极化发展。
智能语音市场的“三大拍案惊奇”
中国的智能语音市场很怪,明明每家企业都说自己的产品准确率很高,但是谁也不敢明确自己就是第一。不但没有统一的数据标准,就连自己的测试标准也完全不公开,成为一大拍案惊奇;
拍案惊奇二,虽说各家做语音的时间有长有短,然而技术层面并没有拉开差距。久到深耕行业近二十年的科大讯飞,近到语音行业新秀云知声、依图科技,同样都在数据方面达到了一个相似的百分比。综合技术数据和应用效果来看,各家企业非但没有拉开明显差距,连究竟孰高孰低竟也不太好分辨;
拍案惊奇三,与市场的一片繁荣相比,智能语音产品非常繁杂,但使用体验、终端用户的接受程度和商业市场的变现能力却一直和行业预期存在差距,特别是消费者似乎对于智能语音产品并不感冒,这并非是使用习惯一个方面的原因。
智能语音市场正迎来“三足鼎立”新格局
作为大哥和二哥的讯飞和百度,既然无法短时间内解决“三大拍案惊奇”,市场会自然的引入新力量来平衡和解决怪现象。而在短期内可以看到的变化,即是智能语音市场将会迎来“三类玩家”新格局:干的最早的讯飞,家底最厚的BAT,以及实力黑马的新秀。
玩家一:“大师兄”科大讯飞
跑在第一名的,永远会有被赶超的压力。在智能语音领域,科大讯飞就是这样。作为中国智能语音的奠基者,讯飞以19年的行业深耕,做出了大量的数据积累和行业经验,使其在中文语音合成、语音识别、口语评测等多项技术上都拥有国际领先的成果。
但百密一疏的是,讯飞并没有用技术和应用成果,打造出有效的行业壁垒,并以“老大哥”的身份树立中文智能语音行业的标准,构建明确的行业准入门槛。否则,可能也就不会有凭借体量优势来弥补技术上差距去硬抢老二位置的百度了。
玩家二:流量派BAT
凭借在互联网时代积累的大量资本,BAT在每个科技领域都可以称为“玩家”。但是,与依靠人工智能技术起家,做应用,打市场的AI垂直类企业不同,BAT更多的是以流量导向和满足庞大用户群体验和创新需求为导向去做AI开发。更形象点来说,在AI这个领域,AI垂直企业是“技工贸”企业,而BAT是“贸工技”企业。
既然有如此差别,那么就可以很清晰的看出,以流量和用户体验为导向的BAT解决的是锦上添花的市场需求,并非雪中送炭的强需求,通俗来说BAT玩语音可能不会很认真。
玩家三:技术黑马依图、云知声
最近,AI公司依图科技,宣布进入语音市场,并且在最权威的中文数据集AISHELL-2中达到了96.29%的准确度,成为业内第一个敢于亮出测试数据集标准的企业,并且用“实力”而不是“数字”领先所有其他厂商。
依图科技科学家认为:语音识别的准确程度存在着两条“红线”,代表着实际应用的两道门槛。一条为字错率15%的红线,超过这条红线,应用的感受度极差,可以称作不可用。而另一条则是3%的红线,小于这条红线的水平在实际应用可以满足大部分的日常需要,而目前距离这条红线、尤其是在复杂场景的情况下,还相距甚远。
智能语音从技术突破开始,到应用、终端和场景的不断突破,再到回归技术,渐成业内共识。应用、终端和场景带来的大量应用数据,更为机器学习、深度学习带来了技术突破的充分土壤,这也是为什么以依图科技为代表的技术型公司能够在智能语音领域快速赶超的原因所在。同时,语义识别的加入、知识图谱的构建和技术的快速迭代,也为智能语音技术进入3%红线、甚至达到更高识别率带来可能。
云知声创始人梁家恩也认为,目前还没有一个较为成功的语音产品,真正的语音产品尚未出现。国外诸多厂商如谷歌,苹果也都认为语音行业的发展和变现还有很长的路要走。
技术,场景与流量,是决定整个语音领域走向的三大要素:技术决定场景应用的革新性和深度,场景决定资本和应用的流向,流量决定整个行业发展的广度。对行业水平的三个拷问一方面指出目前行业的存在的不确定性,另一方面解决三个问题也将为行业的发展带来新的机遇。
在语音识别发展的道路上,老玩家与新黑马必会在全新的赛道上一较高下,而决定这场比赛胜负的关键,也许就在今天行业的浪潮之中。