小米电视4A核心技术之语音识别浅析
扫描二维码
随时随地手机看文章
大屏电视成流量入口,语音识别成核心竞争力。近年来,大屏智能电视市场销量持续走俏,基于语音识别功能的互联网电视更是备受消费者青睐,小米电视4A便是其中之一。
据有关数据发布的2017W15液晶电视线上零售额排名统计显示,近几周小米电视销量持续排名第一,相关人士认为,小米电视近几周之所以稳居销冠宝座,这与近段时间发布的小米电视4A所具备的人工智能语音功能有关。
有人认为,小米电视4A人工智能语音识别功能解决最大的痛点就是老人和小孩的节目难搜索问题,但在精准识别技术上并未达到100%识别,而这也是目前市面上人工智能语音识别领域的一大通病难题。
精准度虽未达100%,但在智能电视行业中,小米电视4A的语音识别技术仍走在前列。
前不久,小米电视4A的发布会上,小米王川进行了现场演示,分别从5个等级测试诠释了人工智能语音识别技术的魅力和不足点。其主要魅力特点表现在完美实现了前4个等级测试:元素拼加类型的搜索、模糊形容搜索、混乱人物关系排序、根据内容跳转电影,但在第5个等级测试中用“同音词语”指令识别失误时展示了语音识别的缺陷。
现在智能电视大部分都已进军人工智能语音电视领域,虽然在技术识别精准实现上有所差异,但在技术逻辑上却如出一辙。
以小米电视为例,当我们通过小米电视4A的语音识别系统发送语音控制指令时候,电视系统收集信号后,通过其自身的模拟数据预处理,将其转换为数字语音信号,再根据模块需求将数字语音信号数据发送至云端,经由云端语音识别分析处理并发送控制指令给到云端,这样我们就可以通过语音来控制电视机收看想要的媒体视频内容。
小米电视4a的高精准语音识别与电视系统的模块设计完善程度密不可分,据了解,人工智能语音电视系统结构分为三个模块。
模块一:语音识别系统
这一模块主要是将电视收集到的模拟语音信号转换成云端的数字语音信号。这一阶段所利用到的语音IC处理技术能够帮助模拟信号进行预处理,然后再通过语音波形的特征参数抓取反馈至电视操作系统。
图片为中文的小词汇量孤立词语音识别波形图,来源:网络
模块二:电视系统处理
电视系统是连接语音识别系统和云端处理系统的桥梁。在接入互联网状态下,电视系统通过接收语音并对其进行预处理,针对特定电视系统则拥有特定模块特征,将模块特征和语音数据传输至云端。
模块三:云端处理系统
正如马云所说:“人算不如天算,天算就是云计算”。云端处理系统就是通过云计算对数字语音数据进行分析处理,并进行云端智能识别,以此来完成相应语音指令功能。
分析人士认为,智能电视的语音识别技术在今后仍然会是众多智能电视品牌的核心竞争力,除此之外,诸如VR等场景应用也将成为智能电视重要入口。