Google和亚马逊相继开放了语音API
扫描二维码
随时随地手机看文章
(文章来源:雷锋网)
亚马逊表示,其数字助理Alexa背后的人工智能和语音识别软件现在向所有云计算客户开放。这项服务被亚马逊称为Lex,已经在去年12月份的云计算会议上公布过,但尚未广泛投入应用。Lex使用了与Alexa相同的机器学习技术,它的算法让应用程序能够进行对话和处理语音和文本。
亚马逊的Lex服务允许开发者依靠语音识别和深度学习技术,开发对话应用。开发者可以不用重新造轮子,直接调用接口就行。这也表明,亚马逊计划在向Alexa平台做了大量投入后,想获得回报。曾有分析显示,在三年内Alexa可能会带来高达100亿美元的收入。其他创收方法还包括出售Echo产品线设备,或者通过Alexa让用户在亚马逊上购物。
对AWS来说,将Lex开放给更多客户可以使其规模化。很多公司没法轻松且大规模地开发具有语音识别和自然语言理解能力的应用程序。如果AWS与Lex能成功,会有越来越多的应用把AI嵌入其中。Google,微软和Facebook都在兜售他们的人工智能平台。像大多数技术一样,能接触到最多的开发者和应用,AI平台获胜的几率就越大。
无独有偶,,并且新版本的语音软件在准备性上有所提升,可以完成转录和语音命令等任务。Google之前已经发布了一个测试版本,但有一定的限制,只能在限定的产品中使用。就在前一天Google云也向所有用户开放语音接口Cloud Speech API
根据Google的说法,新版本的软件也更快,可以使用更多的文件格式,能更准确地转录音频。除了转录外,该软件还用于语音命令,用语音来控制其它设备和服务。
Google大部分资金来自广告和搜索,并将企业产品(如云服务)视为未来收入增长的主要推动力,但这方面仍落后于亚马逊和微软。新版Google语音软件是尝试成为更有竞争力的云服务商的一个例子。这也是在与亚马逊,Facebook和苹果的技术竞赛中,炫耀自己AI能力的方法。
除了语音API,Google还有其他预先训练的机器学习模型,可用于视频分析,图像分析,文本分析和动态翻译。
在价格方面,亚马逊会根据为开发者处理的文本和语音的量进行收费。Google暂时未知,但应该会采用同样的方式。另外,根据Google的说法,现在语音的主要使用场景是语音控制(如车载导航)以及语音分析(多用于呼叫中心)。