这么多深度学习架构,百度还有必要重做一个?
扫描二维码
随时随地手机看文章
去年 3 月 22 号,华为 HiAI 首席架构师杨鋆源第一次听到 PaddlePaddle 这个名字。当时,他的内心想法是,「业界深度学习框架已经很多了,开发者已经是选择困难,百度还有必要再做一个吗?」
如今,他的想法发生了改变:「做深度学习框架需要大量的投入,无论是做框架的提供者,还是广大的学员或者是开发者,都要花很大的精力去学习。平台必须坚持数年连续投入,百度愿意做这件事是国内开发者的幸事。向所有愿意在基础能力投入的组织和个人致敬,因为他们推动了整个产业的可持续性发展。」
杨鋆源想法的改变,源于一项为期六个月的培训。
今年初,百度联合「深度学习技术及应用国家工程实验室」成立「黄埔学院」,旨在为各行各业培养第一批「首席 AI 架构师」。
第一期学员共 35 人,分别来自不同企业和单位(包括国家卫星气象中心、中油瑞飞、中信银行、神思电子、OPPO、广东电网、广东长隆集团、中国联通软件研究院、华为、米文动力、爱奇艺等),当然杨鋆源是其中之一。
他们在北京进修半年,在半年时间里,他们结合自身行业和企业需求,使用飞桨(PaddlePaddle),将 AI 结合到业务实践中应用落地。
上周日(6 月 16 日)下午,他们在百度科技园熊掌报告厅上完「最后一课」后,28 位通过毕业答辩的学员获得了毕业证书,成为百度认证的业界首批「首席 AI 架构师」。
在这半年时光里,陪伴着杨鋆源们一起成长的,还有 PaddlePaddle——中文名为「飞桨」,是由百度自主研发,集深度学习训练和预测框架、模型库、工具组件、服务平台等为一体的开源深度学习平台。
2016 年,在百度世界大会上,百度宣布 PaddlePaddle 开源,国内首个也是目前唯一一个开源开放、功能完备的端到端深度学习平台诞生。
去年,PaddlePaddle 核心框架 Paddle Fluid v1.0 发布了稳定版本;半年来,飞桨(PaddlePaddle)在易用性、性能、模型丰富度等方面取得了大量突破性进展,百度深度学习技术平台部总监、黄埔学院副院长马艳军说。
基于百度多年的产业应用经验,以及百度大脑生态伙伴的人工智能解决方案实践,飞桨(PaddlePaddle)目前已经支持六十多个经过真实业务场景验证的官方模型,涵盖视觉、自然语言处理、推荐等 AI 核心技术领域。
在核心框架层面,它提供开发、训练和预测一整套的技术能力,它同时支持稠密参数和稀疏参数场景,支持千亿规模参数、数百个节点的高效并行训练,为用户提供业界最强的超大规模并行深度学习能力;它提供性能全面领先的底层加速库和推理引擎、Paddle Mobile、Paddle Serving、高效自动化模型压缩库 PaddleSlim,为用户提供端到端全流程部署方案;
为适应工业大生产阶段的「标准化、自动化和模块化」,它提供包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算等在内的工具组件;
在服务平台层面,它提供零基础定制化训练和服务平台 EasyDL 和一站式开发平台 AI Studio,进一步降低深度学习应用门槛,让零算法基础加速推动产业智能化变革。
「飞桨(PaddlePaddle)核心框架 Paddle Fluid v1.5 马上就要发布」,马艳军当日透露。
飞桨(PaddlePaddle)总架构师于佃海、主任架构师胡晓光和董大祥分别从飞桨的基本能力、设计,模型的稳定性和易用性,飞桨在大规模分布式应用场景中的应用等方面,对飞桨在这半年里取得的进展做了更详细的介绍。
于佃海说,最近半年,他们在 OP 的完备性上做了很多建设;飞桨(PaddlePaddle)的 API 也逐渐稳定下来;他们还完善了对应的中英文双语文档,优化了底层性能,并增加了对动态图编程的支持。
胡晓光表示,飞桨(PaddlePaddle)模型库中模型的数量已经从早期的不到二十个模型,增长到六十多个,覆盖方方面面,还包含「非常前沿」的模型。
他还表示,飞桨(PaddlePaddle)提供的算法模型全部源于百度的工业实践,历经大规模数据、场景训练,特别是针对中文的语义表示、情感分析等,百度基于特有的数据算法已可提供成熟稳定的模型,大幅提升训练速度和实现效率。比如机器翻译的模型,在训练上比其他框架快 60% 以上,预测速度快近 4 倍。
董大祥透露,他们在大数据训练的过程中做了很多优化,包括数据分布式的 I/O,随机打乱等功能。他们将在飞桨(PaddlePaddle)的开源项目里逐步增强模型的异步能力,以更高性价比扩展节点。「易用性方面,1.5 版本会发布分布式训练的 API。」