销量连续全国第一 小度智能音箱仍在研究人工智能VS人工智障
扫描二维码
随时随地手机看文章
8月15日,根据Strategy Analytics智能音箱和屏幕(SSS)研究服务今天发布的最新研究报告显示,2019年Q2智能音箱的全球销量持续飙升,达到3030万台,同比翻倍。其中百度小度智能音箱出货量470万台居全球第三,超过阿里巴巴和小米,排名国内第一,与2018年相比,小度智能音箱销量增长高达38倍。
Strategy Analytics数据
这已经不是第一份报告显示小度智能音箱的飞速增长。2019年第一季度,包括Canalys、IDC,Stra tegy Analytics在内的多家调研机构的数据均显示,小度智能音箱市场份额已升至国内第一,全球第三。
百度入局智能音箱领域时间并不长,从2018年3月正式发布有屏音箱小度在家,迄今为止不到2年时间。小度智能音箱何以在竞争激烈的国内市场迅速崛起?
百度首席架构师、SLG首席技术官朱凯华和我们聊了聊小度智能音箱背后的技术故事。
智能音箱区别于传统音箱的突出特征就是可以和人进行语音交互互动。在朱凯华看来,百度智能音箱的优势在于很好的实现了对话式交互的用户体验。
朱凯华介绍,拥有良好的对话式交互,需要解决“听清、听懂和满足”三个问题。听清,要求音箱在嘈杂环境内(不论是外部嘈杂,还是音箱本身大声放音时)能准确的被倍唤醒、并把用户的声音转为文字。
而能听懂,则是对音箱智能性的更高要求。听懂,意味着要能准确的把文字理解为用户意图,人工智能和人工智障,一字之差,说出的是用户体验的天壤之别。
朱凯华表示:“智能和智障的区别,很大部分是要做好‘知之为知之,不知为不知’。在理解的时候快速给答案,不理解时给出合理澄清,不装懂不插科打诨。‘智障’很大部分是不懂而瞎说引起用户抵触。”
朱凯华现场使用小度演示了真正的智能音箱在遇到这方面难题的解决方案:当他对小度说“我想听….”的时候,小度的回答是,“你想听什么呢?”当他再次说出“我想听刘德华的歌”时,小度响应并播放了刘德华的歌曲。
朱凯华介绍,这只是小度“听懂”方面的一个小例子,但这样的能力却已经要高于市面上的绝大部分产品。小度的听懂在于,当它获得模糊需求(不清晰指令)的时候,它会尝试分析和校对自己的指定,以便更准确地满足用户的需求。
除了上述听清、听懂需要的人工智能技术保障外,对话式交互第三个要素“满足”,则需要有丰富的信息、内容和服务来满足用户。简言之,也就是音箱听清听懂了用户的需求,还需要能满足用户需求的能力,这需要设备有完备的知识和技能服务。
“现在流行的垃圾分类话题,比如湿纸巾是什么垃圾,小度也能给出答案。”朱凯华介绍,因为小度背靠百度十亿级的知识图谱、百亿级的搜索请求和万亿级的网页内容,同时构建了33000+平台开发者、2400+优秀技能的生态,是知识和技能最完备的平台。
不过,现在的小度已经不满足于现有的语音交互的智能程度。
在今年7月的百度AI开发者大会上,百度公司董事长兼CEO李彦宏启动了小度在家“极客模式”开始了与智能音箱的连续对话聊天,并介绍了一个极具技术流的的名词“全双工免唤醒”功能。
搭载“全双工免唤醒”功能的小度智能音箱,可以和用户进行连续聊天,不需要每次都呼唤“小度小度“唤醒。这种人机交互模式无疑更加“自然”,离真正意义上的“智能”更进一步。
体验进步一小步,背后是科技人员努力的一大步。要真正做好“全双工免唤醒”绝非易事。
试想,在人声嘈杂的环境里,机器如何准备识别你的这句话是针对它说的,还是对其他人员说的?这对“智能”性程度提出了更高要求。此前市面上有其他品牌展示过相关技术的演示,但工业化量产,目前只有小度率先推出。
对此,朱凯华表示,能够首先推出全双工免唤醒,有3个必要条件:具备软件和硬件结合的能力;语音识别和语义理解结合、端到端的识别和理解整合的深度优化能力;和对所有技术能够进行深度整合的能力。
目前小度“全双工免唤醒”功能已在小度有屏音箱产品和有灯带的音箱产品上上线,主要应用于音乐和有声内容场景。朱凯华透露,该功能很快将拓展至更多场景使用。
对于语音交互技术和智能家居的未来发展,朱凯华认为,从人之间的交流方式来看,输出信息带宽最大的是语音,输入是视觉。未来的交互方式一定是视觉和语音相结合方式。智能家居时代要求设备间有良好的感知与协同能力,多模态交互将是必然趋势。不过,科技不停地向前发展,在技术落地的过程中一定会有各种不同的产品形态,但最核心的是技术能力有没有更好地在阶段时间内满足用户的需求。