未来生活中机器人会帮你端茶倒水
扫描二维码
随时随地手机看文章
在百度AI开发者大会入场口,正对的就是百度大脑的展厅,可见百度大脑在百度AI布局中的地位。
李彦宏表示,百度大脑作为一个拥有全体系AI能力的技术平台,迄今为止已经向所有开发者开放了200多项AI核心能力,这些能力和开发者结合起来,就会产生魔幻一般的力量。星火燎原,AI一定会在各行各业产生越来越大的价值。
百度AI开发者大会中,百度CTO王海峰博士开场便带来了一段传统与科技碰撞的精彩演示——机械臂倒盖碗茶。这个机械臂既会茶艺绝活儿,还能说会道。虽然演示过程简短,但这背后却融合了机器人视觉、语音、自然语言处理等多种人工智能技术,也展示了百度AI技术储备的宽度和技术打磨的深度。
王海峰展示了关于中国民间艺术的音乐纪录片《大河唱》中的片段,影片中的角色、人物关系、音乐种类、取景地、影片主题等信息,都被精准解析。这背后是基于知识图谱的视频语义理解技术。
百度两位工程师,有一次到盲人按摩店,发现因为视力障碍,盲人按摩师的工作有许多不便。他们想到百度的AI语音技术可以帮助他们,于是自掏腰包,给店里装上了小度音箱,改造了空调、隔断帘和灯带,盲人师傅们只要喊一声“小度小度”,就能开关空调、调节温度、定闹钟。这给他们的工作和生活带来了很大的改变。目前,百度AI助盲行动已经开始向更多城市推进。工程师觉得很自豪,他们可以用技术为盲人朋友提供实实在在的帮助。
百度语音技术部高级总监高亮在开发者大会现场说了一段Rap:Hello Everyone,中英混合说是我们的everyday work,Explore技术的depth和scope是我们的responsibility……这段中英夹杂的话被百度输入法流畅、精准、及时地识别出来!这背后是百度大脑流式多级的截断注意力模型(SMLTA),它能让语音识别速度大幅提升,准确率提15%-20%,是首个基于流式注意力的语音识别线上服务。
百度大脑语音、视觉、语言和知识等核心算法法再度重磅升级,发布6大技术突破。包括业界领先的流式多级的截断注意力模型(SMLTA)和风格迁移的语音合成技术;知识增强的语义理解框架ERNIE和基于知识图谱的视频语义理解技术;业界首创的高准确、低时延的机器同传技术。值得关注的是,在语言方面,百度大脑推出知识增强的语义理解框架——ERNIE,再次全面刷新了中文自然语言处理任务效果,超越谷歌BERT。
李彦宏表示,技术是百度的信仰,“用科技让复杂的世界更简单”是百度的使命。百度人在技术创新的同时,也在积极用技术去解决多种社会问题,用科技让世界变得更美好。Do Better,科技为更好!