语音的三座大山是什么

时间：2020-06-02 08:06:01

关键字： AI 智能语音

手机看文章

扫描二维码
随时随地手机看文章

[导读] 在不久的将来，人们与语音助手的对话将成为生活中的常态。无论是亚马逊、谷歌、苹果、微软这些国际科技巨头，还是思必驰、出门问问这些后起之秀目前都在大力布局，希望抢占语音时代的发展“智”高点。

在不久的将来，人们与语音助手的对话将成为生活中的常态。无论是亚马逊、谷歌、苹果、微软这些国际科技巨头，还是思必驰、出门问问这些后起之秀目前都在大力布局，希望抢占语音时代的发展“智”高点。

“早起”的苹果和“迟到”的脸书

语音技术的发展或要追溯到1952年，贝尔实验室制造的自动数字识别机“Audrey”，它可以识别数字0—9的发音，且准确率高达90％以上。

这被视为语音助手开启历史巨幕的起点，最近几年随着云计算、大数据、人工智能等高新技术的发展，智能语音助手才开始真正走进人们的生活。

大部分人第一次接触语音助手，都是从苹果手机上的Siri开始。其实，苹果就是中第一个发布语音助手的科技巨头企业。2011年，苹果在iPhone4S的产品发布会上推出了语音助手Siri。

但可惜的是，苹果“起了个大早，赶了个晚集”，虽然先于亚马逊推出语音助手，但如今的市场份额却远远落后于Alexa。根据市场研究机构Ovum发布的数据显示，目前亚马逊Alexa和谷歌Assistant的用户基数超过了95%，而苹果Siri只有24%。

在随后的几年，谷歌和微软分别推出了语音助手Assistant和Cortana，与Siri和Alexa并称为“语音四大天王”。在距离苹果推出Siri整整8年后，作为唯一一家没有推出语音助手的科技巨头——脸书终于坐不住了。5月31日，脸书首席执行官马克·扎克伯格对外称，公司正在开展人工智能语音助手的研发。

此前，由于没有自研语音技术，脸书推出的两款Portal视频聊天设备都是搭载亚马逊Alexa语音助手，无疑这让脸书在人工智能的发展中处于“被动”地位。这也是即使已落后“语音四大天王”一大截，脸书也要自己开发语音助手的主要原因。

让语音助手听懂“人话”是关键

语音助手的快速发展需建立在其能听懂“人话”的基础上，不然其在“智能”与“智障”之间只有一线之差。

目前，在语音技术的升级上，科技巨头一方面通过自身加强技术创新迭代，另一方面通过收购优秀初创企业来巩固业内领先地位。

6月4日，苹果在全球开发者大会上宣布将对语音助手Siri进行升级，并将在今年秋天公布7大新功能。苹果方面表示，Siri很快会有完全由软件生成的新声音，这将使声音听起来更加准确。

为了巩固在智能语音市场的领军地位，亚马逊特别成立了一支1亿美元的投资基金，专门投资围绕语音应用开发产品的创业公司。与其它公司相比，亚马逊的优势是可以为合作伙伴提供电商、搜索等领域的渠道支持。

微软也通过“买买买”的方式不断对Cortana进行迭代升级。今年微软刚刚收购了加拿大人工智能初创企业Maluuba，这将进一步强化Cortana的机器阅读和编写能力。

无论是依靠自身迭代还是通过外围收购，巨头们的目标只有两个。第一，通过技术迭代，让语音助手更好地与人类交流，抢占市场占有率；第二，以智能语音技术为支点，撬动在医疗、教育、家居、汽车、楼宇等领域的智能化发展。

智能语音发展还需跨过“三座大山”

根据研究机构Juniper Research发布的数据显示，2023年全球语音助手的使用量将达到 80亿，市场规模则将达到800亿。虽然智能语音市场正快速增长，但距离行业的真正成熟发展还需跨过“三座大山”。

1.支持更多的语言。目前，谷歌Assistant已在80个国家支持30种语言，语言数位列第二的苹果Siri则支持36个国家的21种语言。但无论是Alexa亦或者是Siri，都听不懂俄语，这给俄罗斯本土搜索巨头Yandex推出的语音助手Alice创造了巨大的发展空间。

同时，作为Yandex的合作伙伴，全球化AI+IoT平台涂鸦智能正通过“Powered by Tuya”技术，帮助Yandex打破不同品牌和设备之间的信息孤岛问题，加速抢占俄罗斯智能家居市场。

2.加速商业化落地。任何一项技术，没有成熟的商业落地解决方案，都不能取得长足的发展。智能语音市场既有谷歌、亚马逊等国际巨头的布局，也不乏思必驰、Rokid、出门问问这些初创企业的入场，可谓是玩家越来越多，但目前语音技术的商用落地还在进一步探索中。只有具备一套完善、成熟的商业落地解决方案，未来才能推动相关产业的可持续发展。

3.更好地理解人类语言。语音助手不应该仅仅“听懂人话”，更应该根据不同的场景来理解用户的指令，甚至读懂用户的语气。互联网女皇玛丽·米克尔在《互联网趋势》报告中提到，假如语音助手能进一步理解人们说的话，那么语音技术将迅速普及，甚至改变行业现有的发展格局。当然，这对科技公司的技术能力将是一大挑战。

跨越了这“三座大山”，语音技术才能真正进入商业应用的成熟期，在教育、家居、医疗、汽车等领域开辟出新天地。