语音的三座大山是什么
扫描二维码
随时随地手机看文章
在不久的将来,人们与语音助手的对话将成为生活中的常态。无论是亚马逊、谷歌、苹果、微软这些国际科技巨头,还是思必驰、出门问问这些后起之秀目前都在大力布局,希望抢占语音时代的发展“智”高点。
“早起”的苹果和“迟到”的脸书语音技术的发展或要追溯到1952年,贝尔实验室制造的自动数字识别机“Audrey”,它可以识别数字0—9的发音,且准确率高达90%以上。
这被视为语音助手开启历史巨幕的起点,最近几年随着云计算、大数据、人工智能等高新技术的发展,智能语音助手才开始真正走进人们的生活。
大部分人第一次接触语音助手,都是从苹果手机上的Siri开始。其实,苹果就是中第一个发布语音助手的科技巨头企业。2011年,苹果在iPhone4S的产品发布会上推出了语音助手Siri。
但可惜的是,苹果“起了个大早,赶了个晚集”,虽然先于亚马逊推出语音助手,但如今的市场份额却远远落后于Alexa。根据市场研究机构Ovum发布的数据显示,目前亚马逊Alexa和谷歌Assistant的用户基数超过了95%,而苹果Siri只有24%。
在随后的几年,谷歌和微软分别推出了语音助手Assistant和Cortana,与Siri和Alexa并称为“语音四大天王”。在距离苹果推出Siri整整8年后,作为唯一一家没有推出语音助手的科技巨头——脸书终于坐不住了。5月31日,脸书首席执行官马克·扎克伯格对外称,公司正在开展人工智能语音助手的研发。
此前,由于没有自研语音技术,脸书推出的两款Portal视频聊天设备都是搭载亚马逊Alexa语音助手,无疑这让脸书在人工智能的发展中处于“被动”地位。这也是即使已落后“语音四大天王”一大截,脸书也要自己开发语音助手的主要原因。
让语音助手听懂“人话”是关键语音助手的快速发展需建立在其能听懂“人话”的基础上,不然其在“智能”与“智障”之间只有一线之差。
目前,在语音技术的升级上,科技巨头一方面通过自身加强技术创新迭代,另一方面通过收购优秀初创企业来巩固业内领先地位。
6月4日,苹果在全球开发者大会上宣布将对语音助手Siri进行升级,并将在今年秋天公布7大新功能。苹果方面表示,Siri很快会有完全由软件生成的新声音,这将使声音听起来更加准确。
为了巩固在智能语音市场的领军地位,亚马逊特别成立了一支1亿美元的投资基金,专门投资围绕语音应用开发产品的创业公司。与其它公司相比,亚马逊的优势是可以为合作伙伴提供电商、搜索等领域的渠道支持。
微软也通过“买买买”的方式不断对Cortana进行迭代升级。今年微软刚刚收购了加拿大人工智能初创企业Maluuba,这将进一步强化Cortana的机器阅读和编写能力。
无论是依靠自身迭代还是通过外围收购,巨头们的目标只有两个。第一,通过技术迭代,让语音助手更好地与人类交流,抢占市场占有率;第二,以智能语音技术为支点,撬动在医疗、教育、家居、汽车、楼宇等领域的智能化发展。
智能语音发展还需跨过“三座大山”根据研究机构Juniper Research发布的数据显示,2023年全球语音助手的使用量将达到 80亿,市场规模则将达到800亿。虽然智能语音市场正快速增长,但距离行业的真正成熟发展还需跨过“三座大山”。
1.支持更多的语言。目前,谷歌Assistant已在80个国家支持30种语言,语言数位列第二的苹果Siri则支持36个国家的21种语言。但无论是Alexa亦或者是Siri,都听不懂俄语,这给俄罗斯本土搜索巨头Yandex推出的语音助手Alice创造了巨大的发展空间。
同时,作为Yandex的合作伙伴,全球化AI+IoT平台涂鸦智能正通过“Powered by Tuya”技术,帮助Yandex打破不同品牌和设备之间的信息孤岛问题,加速抢占俄罗斯智能家居市场。
2.加速商业化落地。任何一项技术,没有成熟的商业落地解决方案,都不能取得长足的发展。智能语音市场既有谷歌、亚马逊等国际巨头的布局,也不乏思必驰、Rokid、出门问问这些初创企业的入场,可谓是玩家越来越多,但目前语音技术的商用落地还在进一步探索中。只有具备一套完善、成熟的商业落地解决方案,未来才能推动相关产业的可持续发展。
3.更好地理解人类语言。语音助手不应该仅仅“听懂人话”,更应该根据不同的场景来理解用户的指令,甚至读懂用户的语气。互联网女皇玛丽·米克尔在《互联网趋势》报告中提到,假如语音助手能进一步理解人们说的话,那么语音技术将迅速普及,甚至改变行业现有的发展格局。当然,这对科技公司的技术能力将是一大挑战。
跨越了这“三座大山”,语音技术才能真正进入商业应用的成熟期,在教育、家居、医疗、汽车等领域开辟出新天地。