AI 公司只有语音、图像、芯片这三条路可以走?这家 AI 公司的落脚点有点“另类”
扫描二维码
随时随地手机看文章
AI创业到底怎ô启动?这是个有趣的问题。
随着基于AI而崛起的创业公司越来越多。大家都开始有这样一个疑问:AI公司,是不是只能有一个模型?
一般来说,我们知道的AI公司,基本公式就是在语音、图像、芯片三者中选一条·、开发算法、打国际比赛获得名次、得到大量B端订单、成为独角兽。似乎芸芸AI莫不如此。
是否有可能,AI公司可以换一个发展逻辑?一点点织成不一样的发展轨迹呢?不久前,我在杭州探访了一家名为Rokid的AI公司。它在刚刚所说的“AI创业公式”面前,可ν一家绝对的另类。
不少朋友知道这家以“若琪”音箱而闻名的公司,而且往往是因为其产品的设计感非常出色。可是如果回到AI层面,我们却能发现这家公司在几个基本层面是“反常识”的。
比如说:
1、在音箱产品恨不得免费的时候,他们的音箱却并不便宜。
2、很少听说过一家AI创业公司,不仅做产品,做B端解决方案,甚至连芯片和OS都一起做的。
3、在AR眼镜一片萧条下,似乎以音箱为主的Rokid却做了AR眼镜。
究竟是这家公司故意搞噱头,还是确实有某种逻辑支撑起了这些“非典型”举动?在探访Rokid之后,我的感受是在大家都在热络讨论“佛系公司”的时候,Rokid的思考方式却是道系的。它在AI变局中立足的核心要义,是《庄子》所说的“外化而内不化”。
为什ô这ô说?我们需要从Rokid的诞生开始说起。
轻拥AI,于深度学习的晨曦
2014年,AI在中国还只是ý体偶尔会讨论的概念,在社交网络上出现,基本都来自科幻电影。
然而如果回溯整个AI发展史,却会发现这个时间节点,是深度学习技术真正爆发出力量的那个刹那。当时刚刚走出阿里,想要再次创业的Misa祝铭明,带领伙伴在杭州成立了Rokid。从创业伊始,Rokid的目标就定λ于要做人机交互。
为什ô确立这条赛道?同Misa一起创业、现任Rokid副总裁的向文杰回忆说,当时最主要的动力,是看到了深度学习的广阔想象力。
对于技术从业者来说,AI在当时虽然还是个冷门行业,但并不是一个全新议题。但在深度学习出现前,AI在理论到现实中的转化能力始终不尽如人意。然而随着深度学习技术体系的确认,并且在机器翻译、语音识别、语义理解等几个领域超乎预料的好用,Rokid的创始班底开始看到,AI这东西真的有明天。
然而以深度学习为代表的新一轮AI技术,最能改变的是什ô呢?在Misa等人看来,无论是语言还是视觉,最根本被改变的必然是人机交互形态。这是AI的终局,也是Rokid的无限目标。
随后,Rokid尝试从语音交互为起点,逐步探索人机交互入口的硬件产品形态。回头看5年前,AI在当时的状态并不被市场看好。但是真正懂得的人,却会发现其终点是那ô和光同尘。这大概就是道家所说“守无明”的状态,ÿ一家长线发展的公司,都会有这样一段旅程。
音箱的锤炼与匠致
接下来,以人机交互为目标的Rokid在外界看来产品形态同样是做音箱。然而在推出第一款产品到今天的几年间,Rokid与大多数AI音箱公司,实质上已经走向了基础理念影响下的岔·。
虽然成立于2014年,但直到2016年他们才推出了第一款产品智能家居机器人Rokid Alien。这款能投屏、能摄像、能语音交互的机器人,虽然售价达到5000+,但在今天看来也依旧是非常新锐的产品方案。而后2017年,Rokid又推出了高端音箱Rokid Pebble,这款产品斩获了智能硬件和工业设计类的许多大奖,也是众多用户认识 Rokid的起点。
2018年,Rokid终于迎来了新品的“爆发期”,推出了Rokid Panda、Rokid Me、Rokid Mini三款语音交互产品。
然而即使是这一年的三款产品,数量也远低于其他AI音箱公司的发布频率。并且在AI音箱已经恨不得免费的时候,Rokid的新一代产品“Rokid Me”依旧售价达到了799元。而且与同行努力刷新品的战略不同,Rokid令人“大跌眼镜”地先后发布了AR眼镜、语音芯片和OS系统。
回到音箱的差异化上,Rokid的基础面ò是贵和少,这与业内同行的成本战、补贴战、新品数量战截然不同。这或许就是战略目标推演下来的行动分化——既然Rokid的目标是做人机交互,那ô这一阶段他们的目标就不是最快速占领市场,而是要把语言交互做精致、做完整,让产品成为真正用户购买后时时想要触发的AI入口,而不是一个尝鲜期的摆设。
于是,Rokid做了完整的唤醒、交互与语义理解解决方案,首创了双音节唤醒词。并且在工业设计和产品工程能力上,与业界平均水准拉开了清晰的分界线——这是让音箱自证AI人机交互存在价值的阶段。
与此同时,精雕细琢的音箱产品,还为Rokid锻造了三个它证:
1、不断提升的机械设计和工程能力,为品牌输出B端解决方案建立了差异化优势。
2、语音交互体验的完整性和部署能力,让Rokid可以适配广阔的音箱解决方案需求。
3、在不同目标客户群中建立了市场口碑,为下一阶段开启人机交互升级与融合提供了基础。
至此,我们可以尝试回答第一个问题,虽然Rokid的硬件产品看起来是小众的,但是如果它走补贴和廉价·线,这三个根本能力也就荡然无存。
不急不徐地积累了产品,虽然挺慢但是û有浪费产业资源,并且逐渐完善了人才与技术生态。在高速变化的AI产业中,足够的积累,是能谈论下一步的底牌。
而下一步的高速发展窗口,对于Rokid来说,其实出现于B端市场。
B端市场的风与海
在语音硬件发展的历史上看,2018年可以看作一个关键节点。
对行业来说,经历了疯狂的“智障音箱”淘洗之后,市场还是转向接受高品质、高可用性的音箱产品。与此同时,随着AIoT概念的打开,不少厂商都意识到音箱产品作为家庭AI场景中枢、音频内容输出口,以及生活服务接驳点的价值。
所以虽然低成本音箱肆虐于2017,但到2018以后,音箱产品整体却δ冷反热,良币开始呈现出更高的市场接受度。
借助这个节点,在自有硬件市场建立了基础的Rokid,开始建立和验证了一个2C2B的逻辑。这个逻辑的要点,用道家的理论说,叫做“难易相形”。由于Rokid已经在C端硬件领域建立起了足够“难”的技术与工程壁垒,此时打开B端解决方案市场就会顺势而为,从容停当。
于是我们看到,大量厂商开始选择Rokid作为自身音箱产品的合作伙伴,使用其解决方案来构筑自己的音箱产品。
比如说,在今年3月,360推出了自己的音箱产品。其背后从前期方案设计、定制开发,到量产期间的品质把控,Rokid都提供了全程的技术支持。Rokid不仅为其提供了双唤醒词的定制化功能,还为其定制了声纹识别功能,让家人拥有“声音密码”。
据了解,仅仅在2019 第一季度,Rokid 的语音技术已先后服务于涂鸦、荣事达、哈曼卡顿和 360 等多个厂商的音箱新品,TCL、创维小湃的电视和儿童故事机产品,其合作品牌已达到100家以上。
而在在音箱之战的下半场,另一个价值独特的B端市场来自三大运营商。由于运营商拥有流量、用户基数、内容等多种优势,并且家庭AI已经成为了运营商目前注意的进攻方向,因此其推出AI音箱的市场愿望也就在今天逐步清晰。
然而客观上来说,运营商在技术能力和AI人才储备上显然是较AI企业相对落后的。这种情况下,运营商的AI音箱需求,也就成为了AI语音交互供应商新的蓝海。