王海峰:百度大脑AI“头雁效应”明显
扫描二维码
随时随地手机看文章
一年一度的百度世界大会拉开帷幕,今年的主题是“Yes AI Do”,在这场盛会上我们将全面了解百度过去一年以及未来一年的“最重要的决定”。与往年不同的是,今年百度世界大会主论坛放在了下午,上午首先开始的是百度大脑分论坛。
百度大脑是百度AI集大成者。这两年,在百度大脑上诞生的DuerOS和Apollo两大AI平台已经成为百度AI两面鲜艳的旗帜,在前方冲锋陷阵。百度大脑作为技术平台,似乎退步身后。在这次百度大会分论坛,我们看到,百度大脑又冲上了前线。
AI技术平台体系(AIG)总负责人王海峰表示,“百度大脑既带动了百度业务的升级,也在推动社会智能化升级。” 百度大脑发挥AI“头雁效应”明显。
百度大脑完善了从深度学习技术、定制化工具与平台、语音技术、计算机视觉、自然语言处理等场景化能力到行业应用的全栈AI开放平台,并且深入企业服务、信息服务、地产物业、智慧工厂、智慧校园、智慧政务等行业,打造商业闭环。
AutoDL超越专家设计
据了解,百度很早就开始布局人工智能算法技术。2010 年,百度开始在搜索引擎中应用机器学习;2012 年 1 月,启动深度学习技术研发;2013 年,成立深度学习实验室,并推出自主研发的深度学习平台,即 PaddlePaddle 的前身;2016 年 8 月,PaddlePaddle 正式开源,成为国内最早且唯一的开源深度学习框架;2018年AI开发者大会上,百度发布PaddlePaddle 3.0其中核心框架包括EasyDL(快速应用平台)、AutoDL(网络结构自动化设计)、AI Studio(在线实训平台)等。
此次,百度大脑发布技术全面领先的深度学习全功能套件PaddlePaddle Suite,从核心框架、模块及组件、服务平台三部分满足深度学习开发的多种需求。
百度的自动化深度学习工具AutoDL也进入了2.0,据称,机器自动构建的深度学习网络已经全面超越专家手工设计。AutoDL支持深度学习设计、迁移、适配,使得没有大数据、大算力、工程师团队也能直接使用深度学习网络。
自然交互智能音箱
高亮介绍到,远场语音交互的基础问题是要唤得醒,听得清,但还有更多体验的问题需要解决:每次交互都要唤醒,话没说完总被截断,不知道说话人是谁,没有上下文联系,外部噪音识别太差。
百度创新了语音语义技术以实现一次唤醒连续交互,也能解决以上交互体验的问题。这个技术也是谷歌和微软发布的“全双工语音交互”技术。
高亮在现场演示了新款音箱。在大会会场这样高噪音的环境下,说话的距离超过1米,音箱的唤醒和识别表现很好。一次唤醒就能多次对话,智能音箱在说话时,也能聆听用户的新命令并且快速执行。从更多的演示demo来看,其也能实现一定的上下文理解。
据高亮介绍,一次唤醒多轮对话的能力依赖于多项声纹、语音、语义技术的进步,包括创新的尾点检测技术,其利用云端信号AD技术一边做语音识别一边发给语义VAD,将声学技术与语义技术结合在一起,能够适应用户说话速度,知道用户什么时候说完了,不在中间打断。
鲁棒拒识技术创新了声纹跟踪、语音置信度、声学置信度,可以基于特定说话人的场景化识别,拒绝非音箱交互人声,拒绝聊天内容与场景不一致的对话。
机器人躲避人流
计算机视觉是人工智能最热的赛道,诞生出多个AI独角兽公司,2018年CV赛道趋于平静,新的风口转向三维视觉。百度也展示了自己在三维视觉方向的进展。
百度三维视觉首席科学家杨睿刚介绍了百度视觉语义化平台技术架构,包括底层的芯片、传感器、硬件到图片分析、视频分析等技术和应用。
百度大脑的三维视觉主要应用于图片分析、视频分析、AR和机器人四个方面。
图片分析里引入人脸信息,活体识别正确率高达99.55%,此能力已经集成到手机上;视频分析的三维人体跟踪,人体检测和跟踪准确率超过95%,主要应用于零售行业,百度AI赋能海信智能商用打造新一代AI智慧零售门店AIR;AR方面,推出DuMix AR3.0视频特效解决方案,在多达20款应用进行整合;机器人导航方面,通过创建仿真学习环境,以百万次的训练可以得到在复杂环境中也能运行的导航算法。
语言与知识技术平台
在自然语言处理方面,百度创新了面向行业的语言与知识技术平台。百度大脑发布“语言与知识技术平台”,打造针对行业的解决方案,从客服和媒体内容创作深度切入。该平台可以输出全流程客服智能化解决方案,相对人工客服,人工通话接单量降低70%,人工客服通话人均时长降低50%;相对传统按键智能客服,人工通话接单量降低20%,人工客服通话人均时长降低15%,从而提升行业效率,降低业务成本。在媒体内容创作方面,仓颉语言生成平台可为用户定制专属“AI创作助手”,其内置的丰富素材、模板和知识图谱可通过多模理解和语音生成输出特定内容,提供一站式多场景语言生成能力,且具备灵活地应用方式,可以大大提升媒体从业者的工作效率。
“百度灵医”
“AI+医疗”是备受关注的领域。此次百度也发布AI医疗品牌“百度灵医”,旨在以循证医学为基础,整合多项AI技术,以赋能医院及行业伙伴为目的,以帮助提升基层医疗水平为主要目标,辅助医生提升诊疗效率,从而惠及更多患者。不仅如此,百度还打造眼底AI筛查一体机,使基层医疗机构具备眼底筛查能力,帮助人们更早发现和预防眼科疾病。百度AI眼底筛查系统可以帮助患者快速筛查包括糖网、青光眼、黄斑病等多种眼疾病,目前已在多个地区落地,累计服务
如果说以上都是百度大脑AI技术能力的升级迭代,那么以下要说的就是百度AI生态方法论的升级。
百度AI生态方法论升级
在BAT中,百度是最早搭建起AI开放平台的公司,期望以AI技术赋能B端,树立起AI时代领队者的角色。人工智能竞争之势愈演愈烈,平台公司会发现仅仅开放AI技术是不够的,在不少行业,AI技术与场景的结合还存在很大的鸿沟,将AI与场景应用深度结合将成为各家企业的取胜关键。
百度此次展示了如何深入垂直行业,打造AI商业闭环的全新方法论,主要有AI市场、燎原计划2.0、百度大脑行业创新合伙人计划。
百度除了将自己的AI技术赋能行业合作伙伴之外,2018年5月,百度AI开放平台上线了“AI市场”,作为第三方平台帮助整个行业的AI技术开发者与AI技术需求方建立联系。服务商可以在AI市场开设及管理属于自己的店铺及发相关产,包括技术服务、实体产品、解决方案、产业链周边服务等。
平台搭建之外,百度以“燎原计划”、“百度大脑行业创新合伙人计划”来招揽合作伙伴,共同将AI技术深入应用到细分领域。
2017年10月,百度在深圳发布名为“燎原”的AI开发者扶植计划。该计划拟在2018年为百度招揽500多家生态合作伙伴,培养超过5000名人工智能人才,遴选60多家创业公司进入AI加速器,并投资其中的优秀者。自燎原计划发布以来,加入企业已超200家,其中有73家优秀企业进入了百度AI加速器。
在此次大会上,燎原计划升级到2.0。燎原计划1.0是以平台化AI技术开放,促进AI技术的平等获得与创新应用,主要的形式是百度大脑+开发者(生态合作伙伴);燎原计划2.0是基于1.0之上,推动AI产品与方案形成交易闭环,实现变现共赢。主要形式是百度大脑+开发者(AI市场服务商/生态合作伙伴/行业创新合伙人)+AI产品/方案+AI市场+客户。
百度还新推“百度大脑行业创新合伙人计划”, 在每个细分领域最多选择3家企业,百度将为合伙人提供深度支持,联合设计和开发产品,最后共同推动产品落地市场。10月18日,百度大脑在北京召开了行业创新论坛,此后还将走进将走进成都、深圳、上海、苏州和武汉,展示企业服务、信息服务、地产物业、智慧工厂、智慧校园、智慧政务等解决方案。
总结
在看来,提起百度AI战略,我们首先会想到对话式人工智能系统DuerOS和自动驾驶Apollo,这两大AI平台深入对话式人工智能和自动驾驶两大领域,为百度AI打头。百度大脑作为百度AI技术的基础平台,为百度产品提供了全方位AI支持,但是在行业落地上面不如DuerOS和Apollo。此次大会展示了百度大脑的各项技术能力在各个细分领域的关键支持作用,同时我们也看到了百度大脑打造AI生态的全新方法论。
百度大脑分论坛,作为百度世界大会的首场论坛就已经有这么多的内容,下午的主论坛,我们将拭目以待。