让声音还原度更高,探索Audience成功的奥秘
扫描二维码
随时随地手机看文章
目前旗下相关音讯处理技术广放应用在高阶智能型手机,甚至微软Kinect也有应用其技术的Audience,此次在Computex 2013期间也做了小型的技术应用讲解,透露目前将因应「二合一」装置的兴起,将大量着重于PC,甚至混合型装置的产品应用市场。
Audience市场营销副总Bart DeCanne
运用听觉神科学技术 让人声听得更清楚
Audience本身是一家以打造DSP音讯芯片解决方案的厂商,主要技术着重于透过听觉神经科学技术来模仿人耳所听到环境声音,同时可针对环境噪音滤除降噪,并且提升自然语音部分的呈现,例如将视讯会议时的背景环境声音予以减少,进而让人声部分变得干净、容易识别。而另外的应用则是套用在智能型手机语音指令、查找等应用,不用刻意提高音量才较有办法成功被装置识别。
而此次主要因为近期混合式装置市场越来越广,同时Intel在此次Computex 2013中也强调「二合一」使用概念,因此Audience认为可以让声音的应用可在这些混合式产品广泛整合语音输入、视讯应用等功能。以现行发展,目前Audience已经与广达、Dell有深度的合作应用,同时相关产品也套用在包含三星Galaxy S 4、LG OpTImus G Pro,以及中国小米手机等,未来也将与更多厂商合作,并且相当看好未来语音应用在装置市场上的发展。
目前市场已约有超过150款合作硬件装置,目前全球约超过3亿组芯片出货数量
左侧较小者即为Audience DSP音讯芯片
「听得清楚」、「听得懂」、「身历其境」
根据Audience市场营销副总Bart DeCanne说明,Audience现行技术主要包含「听得清楚」、「听得懂」,以及「身历其境」,分别提供可将背景噪音减少,让人声语音部分更显清晰,或者是透过单一或多方指向性处理技术,可捕捉源自特定方向的声音来源,并且完成背景声降噪、去除动作。
而借助于让语音清楚分离,亦可用于使装置能清楚透过软件或连网方式进行识别、转换语音内容,进而应用在网络资料查找、转为文字输入或简单的语音操作指令等。
至于针对语音识别部分,分别Audience技术可对应最多4公尺长距离与约正常使用笔电的短距离辨识,最多可针对办公室视讯应用作多向性录音,并且在实际交由软件端进行运算时就会进行降噪,因此资料运算时将会以干净音讯内容应用。至于在麦克风数量使用规范部分,Audience目前最高可支持三组麦克风收音,而实际取得音讯质量自然会基于麦克风数量多寡,以及相关录音软件算法而异。
此外,在降噪部分也与麦克风数量、实际算法应用有关,一般来说,在办公室或一般生活的环境噪音几乎可以顺利降噪,但如大型演唱会般有动态性环境噪音情况,可能就不是那么容易实现降噪效果。不过,随着降噪技术的演进,或许之后也有可能让降噪效果提升。