分布式深度学习训练

本talk将分享如何在IA架构服务器集群上利用基于英特尔优化的Tensorflow、MXNet、PyTorch 开源方案高效地搭建分布式AI模型训练系统,并利用其进行分布式模型训练。

演讲提纲:

  1. 构建基于IA架构的容器或虚拟化服务器集群
  2. 如何在IA架构服务器优化分布式任务性能
  3. 如何利用Horovod构建分布式训练代码
  4. 如何优化分布式训练超参数

听众收益:

  1. 了解在IA架构服务器集群搭建分布式AI模型训练的原理

  2. 掌握在IA架构服务器优化分布式性能的要点

  3. 获得基于Horovod分布式方案训练的经验分享

内容亮点:

  1. 现代Xeon处理器上的NUMA特性

  2. VM、Docker分布式训练环境

  3. Horovod分布式训练

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章