看思必驰与中芯巨头合作 开启AI新局面
扫描二维码
随时随地手机看文章
进入 2019 年, AI 技术的场景落地和商用化会成为一个更迫切的议题,但语音识别已是所有 AI 技术中最成功的领域,眼前有四大AI语音公司思必驰、云知声、Rokid 、出门问问不约而同投入“造芯”运动,开始押宝自制 AI 语音芯片,开启第二战场!
“融资”与“造芯”成为 AI 创业公司两大主轴议题,思必驰在 2018 年完成 D 轮融资后,即透露与某芯片巨头进行 AI 芯片的研发,如今答案揭晓,思必驰旗下的芯片设计公司“深聪”获得“国家队”中芯国际旗下的股权管理公司中芯聚源投资,同时中芯国际也为深聪打造第一颗 AI 语音芯片。
“百箱大战”时代开启 ,AI 语音芯片热度火到“互撕”?
基于深度学习( Deep Learning )的语音辨识技术很快成为 AI 创业界的流量担当,尤其 2017 年 Amazon 一口气推出多款Echo系列产品,开始了国内“百箱大战”的年代,更让相关 AI 语音企业迎来一阵小高潮,不少同性质公司更是明争暗斗陷入“互撕”局面,反应该市场的火热程度。
根据 Canalys 估计, 2017 年全球智能音箱出货量突破 3000 万台, 2018 年出货量预计是超过 5600 万台,全球前四大品牌厂为Google、Amazon、天猫、小米。再者, 2017 年全球智能音箱用户量排名前五名是美国、英国、德国、中国、加拿大,但2018年中国可望跃居第二名。
除了音箱之外,智能家居、汽车市场很多应用场景的硬件也会陆续加入语音智能化的功能,都让 AI 语音技术的应用场景增添无限想像空间。
光是 2018 年就有三家 AI 语音创业公司发表相关芯片,包括云知声发表面向 AIoT 市场的 UniOne 芯片、出门问问的 AI 语音芯片模组“问芯”Mobvoi A1、 Rokid 的 AI 语音芯片 KAMINO 18 ,思必驰透露要进入自制芯片领域已有一段时间,4日才正式对外揭露具体战略细节。
中芯国际助阵,思必驰“造芯”如虎添翼
不同于云知声、Rokid进入芯片自制领域,都是在公司内部成立独立部门进行研发,思必驰2018年初成立子公司“深聪”,2019年初推出的第一颗产品是AI语音芯片深聪TAIHANG芯片。
思必驰扶植的深聪之所以引起业界注意,是因为思必驰的“造芯”之路,找来国内半导体巨头中芯国际助力,旗下的投资公司中芯聚源加入成为创始股东之一。再者,思必驰对深聪的持股比重超过50%。
思必驰自制的首颗AI语音芯片,就是由中芯国际操刀,以40纳米工艺打造,约莫是2017年中启动该芯片项目后,在2018年8月进行流片,11月芯片出来后,现在处于采集样本阶段,预计2019年中将进入风险试产,该颗芯片拔剑出鞘的速度十分快,几乎把需要6 个季度的工作,缩短为3个季度完成。
深聪TAIHANG芯片面向智能家居、智能终端、车载、手机、可穿戴设备等各类终端设备,基于双DSP架构,内部集成codec编解码器,以及大容量的内置存储单元,再者,该芯片也采用了指令集扩展和算法硬件加速的手段,相较于传统通用芯片具有10X以上的效率提升。
深聪联合创始人吴耿源表示,在芯片战略上是两步走,因为背后强大的需求力道驱动,第一颗芯片不单是求快,讲求time-to-market,也专注低功耗、单向反愧实现算法加硬件融合优化的想法。
同时,深聪内部已经开始第二颗芯片的规划,是专用芯片加特定架购,双向沟通更能达到软硬件融合、深度优化的功效提升,以软件需求来定义芯片架构,再用架构去反馈算法,同时,算法也会优化硬体架构,等于是彼此做到双向沟通,预计该颗芯片将在2019年下半年流片,2020年量产。
从“通用”到“专用”,这是一条怎么样的心路历程?
从通用芯片到量身打造专用芯片的过程,想必有一番思考、摸索与探寻,吴耿源接受DT君专访时娓娓道来。
吴耿源分析,思必驰是一家满十岁的企业,这几年赶上AI崛起的浪潮,过去多年的技术积累获得发力的机会,目标战场是物联网,第一个应用场景是智能音箱,一切有了很美好的揭幕,但坦白说,智能音箱终究“ me too ”产品,Amazon 已经在前开路。
思必驰的智能音箱初期用过很多家芯片大厂的通用芯片,但随着产品线逐渐成长茁壮后,许多问题逐一浮现。因为,通用芯片功能再怎么强大,落地到AI场景上会有削足适履之感,加上很多目标市场越来越明确、消费者群聚效应展现后,特制化芯片的需求因此诞生。
AI 芯片在市场上有两路的提供者,早几年都是通用芯片的天下,像是高通、联发科等,这些巨头在芯片战略上,较为着眼于商业利益价值,但是,很多AI应用场景都属于细分赛道,要通用芯片巨头“削足适履”,会比较不切实际。
这些芯片巨头当然也会想要“染指”AI市场,但这个市场和他们过去擅长的游戏规则有落差,以前是巨头们设计出什么样的芯片,客户就要乖乖接受,但AI市场是反其道而行,要透过使用者来定义产品,再由把需求反馈给算法,靠算法实现。
但是,传统芯片巨头无法紧密地直接触碰市场需求,或是内部没有强大的算法团队或数据(Data)做后援,在AI领域要成功,算法、数据、正确地定义市场都是关键。
因此,近几年起算法公司开始切入“造芯”运动,也提供给算法公司实现垂直整合布局的机会,更重要的是,借由“造芯”来确保产品的差异化和核心价值凸显出来。
吴耿源表示,思必驰从算法公司跨入产品,再垂直整合成一个平台,上下串连系统,在云端(Cloud)、边缘(Edge)两端都有布局,关键就是欠缺一个硬件芯片去担任执行的角色,而AI领域是软件定义芯片,初期用市面上通用芯片时,也发现算法与芯片对接的过程,有很多文化融合的问题。
举个例子,当算法遇到芯片,发生的第一个冲突是算法的改朝换代速度远快于芯片的工艺技术。
一般而言,从定义产品到芯片诞生于世,大概要“怀胎”两年(24个月),中间经历设计、流片、试产、改版、升级、量产,每一个阶段慢慢磨练,中间经历的循环以“季度”为单位来计算。
反观在算法的世界里,每一个礼拜都在改,循环可能是以“礼拜”作为单位,若将算法与芯片摆在同一家企业中,彼此步伐不一致的问题,会产生明显的内部矛盾与冲突。
思必驰从算法、产品、平台、系统整合布局到整个生态系统,现在加入深聪自制AI语音芯片,布局齐全后,将跨出智能音箱这个“me too”市场,进入AIoT领域,包括TV盒子、白色家电、智慧家庭、故事机等,当物联网遇上AI,商机是无可限量。
多模式人机交互是理想桃花源
吴耿源进一步指出,光是语音AI技术就还有很大的精进空间,现在的智能音箱的沟通仍需经过“唤醒”的程序,其实是“人工弱智”,要做到自然人机交互,当中的技术突破就需要算法的大幅增进,其中一个关键的元素是声纹。
市面上的智能音箱只能辨识出说话的内容,再针对问题给出反馈信息,这样的交互方式是智能化的,但交流方式却不够聪明,因为必须要在明确对象的情况下进行,唯有做到“闻声即可识人”,不需要“唤醒”这个多余的动作,这才是真正的“SMART”。
吴耿源进一步解释,AI语音芯片在应用场景的广度上,绝对不单是音箱领域,还包括物联网、智慧家庭、车载市场等,更进一步场景是多模生态,当下AI是最好的时代,天时、地利、人和,AI时代正在腾飞、国家关注造芯、加上软件、硬件、人和的融合。
现在的AI技术场景分别在语音、视觉两大领域有不错的起步和成功的场景落地,但却都是各自表现,所谓的多模生态是指声觉、视觉、五官、手势、触摸等独立的功能融合在一起,实现自然的多模式人机交互。
AI技术领域的前方是无人区,只能摸着石头过河,每一步都是挑战,但也处处是惊喜。
更重要的是,这是一个国内最有机会与美国科技先驱并行的领域,AI技术的“造芯”运动是日正当中,想想海思追赶高通也花了超过十年,才造就今日的江湖地位,国内发展AI技术有应用场景做后盾,要打造出一家巨星级的企业,这一剑肯定不用磨到十年!