PaddlePaddle首次曝光全景图和中文名“飞桨”，发布11项重大更新

4月23日，在2019年百度开发者峰会上，深度学习平台PaddlePaddle首次对外公布了全景图，并曝光中文名——飞桨，意为快速划动的桨，期望PaddlePaddle实现快速成长。

除此之外，百度深度学习技术平台部总监马艳军还发布了PaddlePaddle新版本的11项重大功能更新，包括开发、训练、预测等环节，并宣布“1亿元”AI Studio算力支持计划，为开发者提供价值一亿元的免费算力。

首次对外公布PaddlePaddle全景图和中文名“飞桨”

2016年，百度深度学习框架PaddlePaddle 正式开源，成为中国首个也是目前国内唯一开源开放的端到端深度学习平台。据马艳军透露，PaddlePaddle 现已覆盖10万开发者，主要为企业用户。

PaddlePaddle最新版本GitHub地址：

https://github.com/PaddlePaddle/Paddle/blob/develop/README_cn.md

发布会上，PaddlePaddle首次对外公布全景图：

（PaddlePaddle全景图）

此外，PaddlePaddle今后将有一个中文名——飞桨，意为快速划动的桨，寓意期望这个平台能够实现快速成长。

11项新特性及服务发布

上图中，黄色框为此次更新涵盖的模块，服务平台包括AI Studio一站式开发平台，工具组件包括PaddleHub迁移学习、PARL强化学习、AutoDL Design自动化网络结构设计，核心框架中的模型库PaddleNLP、PaddleCV，训练模块中的大规模分布式训练和工业级数据处理，预测模块的Paddle Serving和PaddleSlim都有了更新，以下为具体细节：

开发环节：

PaddleNLP工具集

PaddleNLP面向工业级应用，将自然语言处理领域的多种模型用一套共享骨架代码实现，可减少开发者在开发过程中的重复工作，拥有业内领先的语义表示模型ERNIE（Enhenced Representation through Knowledge IntEgration）。Benchmark显示，ERNIE在自然语言推断、语义匹配、命名实体识别、检索式问答任务中超过谷歌提出的BERT。

视频识别工具集

（飞桨视频识别工具集）当天，百度首次发布业内首个视频识别工具集，为开发者提供解决视频理解、视频编辑、视频生成等一系列任务。它开放了7个视频分类经典模型，这些模型共享一套配置文件，并且在数据的读取、评估等方面共享一套代码，覆盖视频识别方向的主流领先模型，还可实现一键式配置来做训练和预测。

训练环节：

大规模分布式训练

（分布式训练Benchmark）大规模分布式训练主要从三方面实现了升级。首先多机多卡的全面高效支持，提升了速度；其次是在CPU的应用场景方面，针对**大规模稀疏特征**设计并开放了大规模稀疏参数服务器，开发者可轻松下载相关镜像使用；大规模分布式训练支持在各种容器上高速运行，同时支持在**K8S生态下**使用PaddlePaddle进行训练。

(大规模系数参数服务器) 2. 工业级数据处理

数据处理方面，优化分布式 IO，增加远程文件系统流式读取能力。GPU 多机多卡同步训练通过增加稀疏通信能力提升带宽不敏感训练能力，在低配网络带宽网络环境下，例如 10G 网络下，同步训练可提速 10 倍。

预测环节：

开发和训练后，将模型部署到各种应用场景下是非常关键的一个步骤。部署环节需要高速的推理引擎，在此基础上，为了部署在更多的硬件上往往需要做模型压缩，在真正使用时，还需要软硬一体能力的支持。基于此，PaddlePaddle准备了完整的端到端的全流程部署方案，并将持续扩展对各类硬件的支持。基于多硬件的支持，PaddlePaddle提供底层加速库和推理引擎，全新发布Paddle Serving支持服务器端的快速部署。

不仅如此，飞桨还发布了模型体积压缩库PaddleSlim，用两行Python代码即可调用自动化模型压缩，经过减枝、量化、蒸馏处理，针对体积已经很小的MobileNet模型，它仍能在模型效果不损失的前提下实现70%以上的体积压缩。

工具环节：

在工具组件模块，PaddlePaddle还开源了AutoDL Design、升级PARL，在算法的覆盖、高性能通讯以及并行的训练方面做了支持和扩展，10分钟可以训练一个Atari 智能体。

此外，飞桨还全新发布了预训练一站式管理工具PaddleHub。

预训练模型管理工具PaddleHub提供包括预训练模型管理、命令行一键式使用和迁移学习三大功能，10行代码即可让开发者完成模型迁移。

AI studio亿元算力支持

会议接近尾声，马艳军还宣布了AI Studio即将推出的亿元算力支持计划，即飞桨将为开发者提供价值一亿元的免费算力。

据介绍，免费算力主要以两种模式提供，第一种是一人一卡模式，V100的训练卡包括16G的显存，最高2T的存储空间。另外一种是远程集群模式，PaddlePaddle提供高性能集群，供开发者免费使用，获取前者需要使用邀请码，后者现在登录AI Studio即可使用。

路线图：11月实现动态图与静态图灵活转化

最后，马艳军展示了飞桨从2016年建立到今年的路线图，其中值得关注的是其在动态图方面的计划。路线图显示，到今年11月，飞桨将实现动态图和静态图的灵活转换，支持高层API，且训练速度全面优化，还将发布PaddleHub 2.0以及多项行业应用解决方案。

马艳军表示，飞桨今后的目标是让核心框架易用性和性能的持续提升，虽然目前PaddlePaddle的实现比较简洁，所以在易学易用方面有自己的优势，但飞桨还将持续降低它的使用门槛，让开发者觉得它越来越好用。另外，飞桨将更关注模型和工具在真实场景中的实用性，一方面变得更好用，另一方面满足产业实践的要求。

Q&A

会后，马艳军在采访中进一步详解飞桨深度学习平台，并表达了他对深度学习的看法。

Q：ONNX使得不同的深度学习框架可以采用相同格式存储模型数据并交互，阿里巴巴的XDL支持任意开源深度学习框架，采用的是桥接的理念，两种产品虽然不同但总体思路，都是用一种产品支持所有深度学习框架，这样的思路您怎么看？

马艳军：ONNX现在确实有几个框架在支持。ONNX更多的是在底层的算子实现层做标准，实现统一。各个框架要想兼容这种格式其实有不小的开发成本，是因为深度学习模型是在不断增加、不断被研发出来的，在使用了某个深度学习框架以后，就会按照这个框架的要求不断往里面加算子，可以实现这些模型。因此，现有的框架转换为采用ONNX标准都有不小的成本。目前应该说还没有一个很明朗的趋势，表明大家都会用统一的一套算子或标准，不一定最后会实现统一的框架，而是可能多个框架都在用。

Q：Paddle和Pytorch、TF相比差别主要在哪里？

马艳军：第一，PaddlePaddle是在我们的产业实践中持续研发和完善起来的，我们的slogan也是“源自产业实践的开源深度学习平台”。因此PaddlePaddle贴合实际应用场景，真正满足工业场景的应用需求。PaddlePaddle也开放了深度学习产业应用中的最佳实践。如官方支持面向真实场景应用、达到工业级应用效果的模型，针对大规模数据场景的分布式训练能力、支持多种异构硬件的高速推理引擎，训练所支持的数据规模、训练速度、推理支持的硬件全面性、推理速度更优。

第二，PaddlePaddle不仅包含深度学习框架，而是提供一整套紧密关联、灵活组合的完整工具组件和服务平台，更加有利于深度学习技术的应用落地。目前PaddlePaddle完整具备了端到端的平台能力。去年我们就将PaddlePaddle定位为深度学习平台，我们布局也是很早的。所以，我们出的各种相应的配套工作都做得非常完善，开发者能在实打实的应用里体验到，在这个方面PaddlePaddle和其他框架相比形成了自己的特色。

Q：PaddleNLP以前包含很多官方模型，前期预处理数据或文本数据处理比较麻烦，这次会不会包括在内？

马艳军：自然语言处理和视觉技术确实不太一样，对于很多NLP的任务，端到端的深度学习还不能直接解决问题。在NLP包里我们提供了针对一系列任务的处理工具，包括预处理和后处理，这是PaddleNLP里的一些功能，并且这块功能也是我们持续完善的点。之所以叫它工具集，就是希望在这些任务场景里包含这些能力，这样用户真正在用的时候，就觉得都能跑得通，跑得顺，不需要前后准备很多工作。

Q：今天发布的新模型都是用一套骨架、相同的API？

马艳军：NLP里的模型比较多，针对不同的网络结构，针对不同的任务可以选择使用这些网络结构，也可以基于这些网络结构做出新网络。之前是针对每一个任务都要从头到尾把这一套都跑一遍，写针对各种任务的工具，最后工具之间互相没有关系。PaddleNLP做了一些任务的抽象，最后放出来的是一套工具，只要修改配置都可以在上面跑了，避免任何工具都要重新写一遍，提升效率。

Q：您认为引领下一波机器学习进步浪潮的将是哪个/哪些技术？有人说是迁移学习，您怎么看？

马艳军：深度学习本身的能力，不管是它灵活建模的能力还是强大的表示能力，这些内在的潜力还可以继续挖掘，并由可能产生新的突破；另一方面，它和一些其他方法的结合，比如说它和知识图谱结合，和强化学习结合，都有可能在一个特定的领域产生一些突破。深度学习和迁移学习也有很多好的结合点，比如深度学习的预训练模型做Fine-tuning就能应用到很多场景，这也是个趋势。当然，这点也是发挥了深度学习本身的技术优势，基于深度学习的预训练模型，我们可以把它迁移到很多场景发挥作用。

关于深度学习数据的问题，也有很多解法，比如通过自监督的方法可以解决数据少的问题，这里还有很多可挖掘的点。所以，深度学习领域还在持续出现有影响力的成果，未来还会有更多。

PaddlePaddle首次曝光全景图和中文名“飞桨”，发布11项重大更新

首次对外公布PaddlePaddle全景图和中文名“飞桨”

11项新特性及服务发布

开发环节：

训练环节：

预测环节：

工具环节：

AI studio亿元算力支持

路线图：11月实现动态图与静态图灵活转化

Q&A

Kafka存储机制

aws语音呼叫调用，告警电话

【转】[C#] WebAPI 防止并发调用二（冥等性）

HTTP URL 详解

创新工具：2024年开发者必备的一款表格控件（二）

车牌识别控制台可快速整合二次开发

愛奇藝全球首發互動視頻標準IVG，融合多種AI技術

甲骨文中國研發中心裁員900人，給出“N+6”賠償方案

2019年，醫療AI的熱潮將會退去

一鍵修復女神林青霞舊照，背後用到了哪些AI技術？

PaddlePaddle首次曝光全景圖和中文名“飛槳”，發佈11項重大更新

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結