首位跨栏者现身:百度大脑的智能对话应用飞跃
扫描二维码
随时随地手机看文章
首位跨栏者现身:百度大脑的智能对话应用飞跃
我们对于AI应用的追逐过程如同跨栏,此时此刻回头看看,会发现“计算”、“感知”和“决策”这些横栏,都已经在我们身后。如今我们已经可以熟练的用语音识别和图像识别来感知信息,再通过机器学习对海量数据的处理来给出结论。
如果问下一道横在我们面前有待跨越的横栏是什么,想必就是意味着“沟通”的智能对话技术了。
横栏在前:智能对话技术跨越的前一秒
建立在语音识别和语音生成等的NLP技术上,人机对话之间的简单对话已经非常普及,像是通过语音唤醒某一项设备或功能,或是和智能助手进行一些单轮问询。但想要系统化地普及智能对话技术,实现人机之间流畅的理解和多轮对话,恐怕还有着不少限制。而这种限制,已经到了亟待跨越的时候。
第一, 缺乏灵活的自然语言交互对话,我们在进行人机操作时依然需要依赖按键、屏幕等等设备,对于AI技术的应用场景有着很多桎梏。
第二, 在无法进行智能对话的前提之下,很多需要频繁沟通的工作,依然无法被AI代劳,即使AI已经远超人类的记忆存储、计算决策和感知能力。
举例来说,在车载、智能音箱、客服和机器人这四大领域中,智能对话技术应用的便利与否,就与其体验息息相关。在车载场景中,人们无暇用手与眼与AI进行交互,必然要依赖灵活精准的对话系统。至于智能音箱这类硬件,智能对话不仅限制其产品形态,也会影响其服务能力。智能客服与机器人更不必说,对于这种以交互为主的产品,能否拥有自然的智能对话技术,实则是根深立命之本。
从市场表现上,我们也能发现智能对话正在进入工业级应用爆发的潜伏期。
目前来说,一项技术爆发所需要的四个因素:技术高度、生态广度、用户取向和企业需求,在智能对话领域已经尽数铺垫完成。
像自然语言处理、语音技术以及知识图谱等技术已经储备完善。数据显示,在行业应用中38%的企业已正在应用基于智能对话的系统、麦克风阵列等上下游硬件解决方案,也在智能硬件市场的成长中达到一定积累,行业生态覆盖正在加速。数据显示,2019年Q1中国智能音箱销量同比增长9倍,移动终端、车载系统、智能硬件等产品中引入对话交互的现象也日益普及,毫无疑问,用户无比渴望更便利的交互方式。最后,在人力成本日益提高时,企业对于智能对话的需求也越来越旺盛,据与IDC联合调研,有83.3%企业认为智能对话能有效降低运营成本。
在今天,百度举办了百度大脑智能对话引擎及产品发布会,宣布了百度大脑智能对话定制平台UNIT3.0的全新升级,并展示了智能对话生态全景。
就此,我们或许可以确定,人类终于向“沟通”这一AI应用的横栏发起了跨越冲刺。
复合型技术的迷墙
如果将百度大脑看做智能对话技术应用的第一个跨越者,我们也可以从中倒推出这项技术应用的难点在哪里。
一般来说,某一项技术工业级应用的突破要取决于成本效率比、人才储备、配套服务和概念认知之上。
智能对话的特殊之处在于,这项技术的复合性极强,包含了语音识别、语音生成、语音语义一体化、知识图谱构建等等一系列技术。这就意味着这项技术的成本必然相对偏高、人才储备也多半集中在技术企业和科技巨头之中。
而智能对话技术所应用的场景又相对复杂,交互本身无处不在,智能对话技术既可以向智能客服这里软件服务领域输出,又可以投入于智能耳机、智能音箱这类硬件领域。更有很多全新的应用空间亟待开发。配套服务的普及,一定是一条相对艰难的道路。
综合下来,会导致智能对话技术距离应用场景间隔了一道迷墙,注定了很多企业对这项技术的认知理解有所偏差,认为这项技术还并不适合自己的企业应用。
这就是为什么,率先动身跨越横栏的人,会是百度。
发起冲刺:UNIT 3.0和语音技术平台正在蓄力
在百度大脑的智能对话生态中,为整个产业开放了两个重要产品平台。
第一是为开发者提供专业对话系统定制技术的UNIT 3.0。
基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的AI技术,百度大脑推出的UNIT3.0版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级,其中为开发者提供了很多预置能力,例如有关天气、闲聊、定会议室的对话技能,还有大幅提升样本生产和标注效率的DataKit和一系列知识库。
建立在这种模块化的组件模式上,开发者定制对话系统就会变得像拼乐高一样简单,而非是过去那样,在一团杂乱的毛线中寻找线头。如此以来,将极大地降低开发成本和时间成本,极大地提升效率与性价比。
第二个产品平台,是包含了领域语音方案和语音自训练平台的语音技术平台。
相比更倾向于赋能开发者的UNIT 3.0,语音技术平台则进一步为企业客户提供了更易上手的工具。
在领域语音方案中,我们可以看到百度大脑推出了他们擅长的端到端一体化解决方案。这次发布会中所展示的呼叫中心语音解决方案,就是一个很好的案例,通过针对于呼叫中心场景优化过专属语音识别模型,结合呼叫中心场景专属8K音库,可以在识别和生成两端进行优化。对于那些适用于呼叫中心场景的企业用户来说,其便利程度接近于即拿即用。
语音自训练平台,则和EasyDL等自动化机器学习平台类似,通过从基础语音模型到行业语音模型再到个性化语音模型的层层训练,最终提升针对于场景业务的语音识别率。而这一整个过程都是自助式的,不需要代码基矗这也自然解决了企业人才匮乏的致命问题。
这两项产品如同百度大脑智能对话生态的左右腿,甩掉了成本、效率和人才的桎梏,直接向智能对话的工业级应用发起冲刺。
客服、消费电子与出行:百度大脑的场景飞跃
那么横栏之后,究竟存在着什么?
一个人的冲刺是毫无意义的,既然冠以生态之名,那么最终目的一定是带领产业一同跨栏。
百度大脑智能对话生态对此,已经给出了三个直面落地场景的方案规划。如同上文所述,目前在车载、智能客服、音箱和机器人几个领域中,已经涌现出了强烈的智能对话需求。百度大脑智能生态给出的落地场景方案,也分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。在这一系列的场景方案中,百度大脑应用了百度技术生态中的综合能力,去解决场景中一贯存在的沉疴。
例如在智能客服领域,智能对话应用的一大难点在于涉及领域过于广泛。而百度大脑智能对话生态不仅拥有UNIT 3.0和语音技术平台这样的平台,同样也借助了百度智能云ABC深入行业在各个领域了累积,就此便可以解决领域的广泛性问题。
在于中国联通软件研究院的合作中,应用了百度AI能力的智慧客服,拥有了更精准的自然语言识别率,可以进行更随意的场景切换。截至目前,中国联通智慧客服已经将10010的15秒服务水平提升至88.7%。
在消费电子领域,百度大脑能够给予合作伙伴的不仅是对于智能对话技术的提升,同样还有一系列配套技术与服务,让客户能够在同一平台之上将智能对话技术与其他技术进行排列组合,创造出更多价值。
就像在教育市场中,围绕着智能对话技术为核心就可以构造出全新的物种。一家来自深圳的教育互动类硬件厂商“好成绩”,就在发布会上展示了应用UNIT 3.0打造伴学机器人“萌宝”的故事。有了智能对话技术,教育互动类硬件可以用更低门槛的交互方式适合儿童应用,也能在不断对话中持续吸引儿童的注意力。更重要的是,“好成绩”表示,百度UNIT 3.0的泛能力强,可以瞬间节约近3个小时的数据标注时间;配置平台上手更快,一个工程师仅用7-10天,就能够搭建出对话机器人。这对于一贯追求速度的深圳企业来说,是至关重要的。
在车载领域,百度大脑的一项垂直技能是可以克服出行领域信号不稳定的情况,推出了定制化离在线融合框架,在多种网络条件下提供同样的对话能力。加之借助于百度车联网云端芯行业解决方案,来实现克服车内降噪、连接车载应用等等常见的车载领域需求。
一个典型的案例是,在百度AI与和奔驰的合作中,建立在智能对话能力之上,奔驰的车载语音系统可以实现对车用说明书的交互化,当人们发现车内的某一个灯在闪,却不知道是什么原因时,可以直接以自然语言与车载OS对话询问,不再需要翻阅厚厚一本说明书,也更适合在驾驶过程中进行。
在AI的整体链条中,以往人类与技术的接触需要文字与图形构建的操作界面才能实现交互,可以说是一个“不智能”的环,连起了智能两端。而智能对话技术的丰满,也让中间的环不断智能起来,我们与机器的交互体验将越来越自然流畅。
不难发现,百度大脑的跨栏优势并不仅仅在于智能对话技术本身,而是凭借自身在AI技术上的长期和广泛投入,在每一环节都有着强大的优化能力。这也证明了,在智能对话这一领域中,百度大脑将再一次成为行业中枢与生态开放引擎。
如此以来,智能对话技术所面临的配套设施不足问题自然迎刃而解。
百度AI:不断跨栏、不断自我进化
最后,我们可以聊聊智能对话生态对于百度AI的意义。
我们知道,百度是国内最早布局人工智能的企业,百度大脑是百度AI技术多年积累和业务实践的集大成者。自百度大脑出现以来,这种开放的形式已经为这个平台吸引来了大量合作伙伴。
对于百度AI自身来说,在智能对话技术的投入是性价比极高的。小度系列已经在智能音箱领域取得了很好的成绩,加上百度搜索引擎的存在,百度自身其实就是一个极为频繁的人机对话入口。智能对话技术的进步,如同在千尺大宅上加盖房屋,就算只加盖了一层,扩展的却也是不容小觑的空间。何况百度已经通过小度助手积累了很多拥有语音交互方面需求的合作伙伴,智能对话引擎的进步,将让百度AI进一步提升竞争力。
尤其交互沟通是人与AI之间必然出现的环节,对于这一环节优化的普遍需求,或许会为百度AI带来更多全新的生态伙伴。
其实对于百度这样将AI应用生态作为追逐目标的企业来说,对于每一项技术应用的“跨栏突破”,意义并不在于横栏本身,而是每进一步时,吸引到的生态伙伴和对自身技术生态的补全。
毕竟终点毫无意义,在追逐的过程中,对于自我的打磨重塑,才是最重要的。