搜狗开放听写服务 与爱国者索尼等成立录音笔AI创新联盟
扫描二维码
随时随地手机看文章
8月28日,搜狗宣布将其核心技术能力“搜狗听写”服务开放,并宣布与爱国者、纽曼、索尼录音笔、万城集团四家录音笔行业头部企业成立AI创新联盟。用户手上的这些品牌的录音笔都可以用上搜狗听写服务。
搜狗CEO王小川表示,搜狗的使命是让表达和获取信息更简单,输入法是帮用户表达信息,搜索是帮用户获取信息。目前搜狗输入法语音请求峰值已超过7亿次,已经成为中国最大的语音输入法。语音识别准确率达到98%,居于行业领先。搜狗的语音增强、语音变声、语音合成等能力已经在多场景落地应用。
此次开放的搜狗听写服务背后包含多项业界领先的技术。其中转写技术已处于行业领先地位,其实时语音转写运用了搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术,非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上。
在语音增强方面,搜狗自研的Smart Voice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原。
在智能辅助編辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备了良好的自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供更多便捷功能。
报告显示,市场上传统的录音笔产品有近20年没有新的技术突破,近2年录音笔行业销售量增长迟缓、市场趋于饱和,迫切需要新的技术变革。
而据介绍,搜狗在今年3月推出了AI录音笔C1,这款区别于传统录音笔的产品一经发布,在极短时间内就在多个电商平台取得了单品销量第一的成绩。这说明市场对智能化的录音笔是有很高需求的。这也是搜狗决定开放听写服务,和录音笔行业头部企业成立AI创新联盟来促进录音笔行业发展的原因。
搜狗听写服务开放提供移动和PC2种接入方式。移动端,搜狗升级推出搜狗录音助手APP,面向联盟的能力升级包括蓝牙协议开放。
PC接入方式上,搜狗听写服务和搜狗输入法PC版进行了打通,传统品牌的录音笔插入用户PC后,通过搜狗输入法来进行搜狗听写服务的调用。
搜狗方面表示,开放听写服务后,可以为市场上90%以上的录音笔产品提供接入服务,让所有有需求的用户享受“录音1小时,出稿5分钟”的体验。