问之科技智能音箱产品“麦宝”,打造智能语音与硬件互联
扫描二维码
随时随地手机看文章
问之科技由翟鲁峰创立于2015年9月,主要为机器人与智能家居领域厂商开发语音交互技术、平台以及硬件产品。今年6月7日,其智能音箱产品“麦宝”正式发布。
问之科技创始人翟鲁峰
到目前,问之科技共有十余个重点合作商家,如机智云、棠棣机器人、南江机器人等。团队近期在优化“麦宝”,接下来将推出“高颜值”的一款;另外还会推出智能语音物联网方案。
注:翟鲁峰向刚承诺文中数据无误,为其真实性负责,铅笔道已备份录音速记,为内容客观性背书。
“语音交互的春天”
2014年年初,“需求来了,创业的春天也就来了。”这是翟鲁峰在做天猫魔盒时,发现其对非接触式交互(尤其是语音交互)需求强烈后的感叹。
天猫魔盒,高清4K网络电视机顶盒,用户长按遥控器的语音键即可语音搜索,直接查询影视歌曲。其中的云OS系统中的语音交互随后也被应用在康佳等数个品牌的智能电视上。
翟鲁峰回忆起在PC时代,用户多用键盘与鼠标来与电脑交互。尽管微软的office软件也支持语音输入,但使用者甚少。从业界整体来看,也很少有相应的硬件产品。
随后的手机时代,用户对语音交互的需求增加,比如Siri的诞生以及广泛应用。
不过此时,语音交互更多是作为其他功能的辅助手段而存在。因为即便没有语音交互,用户也可以很方便地使用手机。但对于去屏化智能硬件来说,触屏输入基本没可能,语音交互成为主要的交互手段。
继天猫魔盒后,翟鲁峰在阿里智能生活事业部分别接触了智能家居与机器人,这样的感受渐深。
“语音交互将成为去屏化硬件的主要交互手段,并且有可能成为家庭智能交互的入口”;与此同时,尽管亚马逊推出智能音箱echo,但国内此类产品尚且不多,而且国内对于音箱的接受度普遍不高,创业机会蕴藏其中。
然而,受限于在大公司难以推进创新业务的通病,2015年5月,他决定离开阿里创业。9月,问之科技成立。
重点是“云”
考虑到国内用户对音箱的低接受度,翟鲁峰想到,一来要尽可能增加智能家居控制等家庭服务功能;二来,要将产品的体积做的尽可能小;再来,要降低定价。
2016年4月,亚马逊推出Echo Dot,其搭载了与前一代产品相同的远场语音识别技术以及语音控制功能。不过由于体积甚小(只有3厘米高),它无法单独发挥前一代产品支持的扬声器功能。另外,Echo Dot价格大幅降低,约50美元。
它所走的路线与翟鲁峰对问之科技产品的设定不谋而合。不过据他解释,他的产品定位是在2015年年底就定下的。另外,与国外不同,国内智能家居市场长时间不温不火,老家电则是占据市场的主要力量。
基于此,翟鲁峰一开始就将红外模式设定在产品设计之中。市场化方面,他决定将产品分为模组与硬件成品,前者面向要做音箱类产品的客户,后者可直接出售。
不过,硬件产品的推出更多是为了云端服务器,“云服务器未来会是包括语音数据、口音、讲话方式、行为习惯、情绪变化等用户数据的沉淀之处”。模组的出售也是为了积累云端资源。
起初,翟鲁峰预估半年内就能将产品做出来,然而事实证明他过于乐观。
因为在产品开发中,语音识别中远讲、唤醒等模块的打磨都花了远超过翟鲁峰预期的时间与精力。为了实现语音远讲识别,就要尽量避开周围环境的干扰,为此,团队反复调试算法与结构,并开发出特定的远讲降噪模组;而为了让人机语音交互更流畅,团队加入Oneshot唤醒+识别。
另外,算法的语音识别等主要部分被放在云端,产品端的则有唤醒识别与机器检测。其中,唤醒识别与响应主要是通过加强版静音检测模块的使用来实现的。此外,针对特定的家庭智能硬件,团队还做了基于语音神经网络(DNN)芯片加速的离线语音识别,用于实现本地端唤醒、云端识别。
◆语音交互模组
年中,语音交互模组发布,陆续有商家前来试用。银行也是客户之一。之前,交通银行智能客服机器人“娇娇”的推出吸引了一大波眼球。
翟鲁峰提到,银行的智能服务机器人一方面确实可以代替银行人员的部分服务,另一方面也是吸引关注的举措之一。而且比起家庭对玩具机器人的低付费意愿,银行的买单率相对要高。所以当时他们对这部分业务也投入了比较大的精力。不过服务机器人语音语义解决方案的正式发布与落地银行则是在今年3月。
年终,语音神经网络芯片与问之云平台1.0——语音云和语义云发布,已可为商家提供服务。
小而轻的“麦宝”
云服务器固然重要,但找到能让用户接受的呈现形态也很重要。为此,问之科技推出小而轻、WiFi即接即用的智能音箱“麦宝”。
◆小巧的“麦宝”
“麦宝”是一个90mm*90mm*30mm的长方体,重量约163克。其可兼容近10万个型号的老家电产品,实现远讲识别、虚拟助理与音箱等功能,并支持在语音交互平台的唤醒词与语义定制。
针对不同的使用场景,为实现更高的适配与识别精准度,团队开发语音语义定制的方法也有所不同。
“麦宝”搭载有问之科技自行开发的语音交互平台,可与用户展开多轮对话(理论上没有轮次上限)。在多轮对话中,系统会主动引导用户给出关键信息,确保任务被准确执行。
在做“麦宝”时,因为想要做成小巧外观,产品内部的播放口与麦克风必然会离得很近,而这样很难实现在音乐播放时的唤醒打断,团队不得不反复调整结构与算法,最终,团队用多模块协作解决了这个问题。
而由于国内工厂在智能音箱方面并没有成熟的方案体系,所以电路与驱动等关键部件由团队自行设计,其他工业设计则交由代工厂完成。
“麦宝”是一款C端产品。之所以选择面向C端,是源于翟鲁峰在做天猫魔盒过程中对客户资源的积累,以及对相应市场生态的了解。此外,团队成员对C端产品更有偏好,也更乐于做直接面向消费者的产品。
“B端产品的市场是有限的,做完一批客户后,基本就是维护,很少能快速爆发;C端产品则不同,当一代人接受了一款新品之后,需求量是非常大的”,基于自己此前开发C端产品的经验,翟鲁峰如是说。
今年3月,问之云平台1.1——语音物联云发布。6月7日,在CES Asia 2017现场,“麦宝”正式发布。
上半年,团队的主要精力都放在音箱产品的设计与生产上,接下来的业务重点将放在智能家居上。到目前,问之科技共有十余个重点合作商家,如机智云。
团队近期在优化“麦宝”,接下来将推出”高颜值”的一款;另外还会推出智能语音物联网方案。