超級計算集羣結合ACK實現NLP訓練

阿里雲最佳實踐頻道:【點擊查看更多上雲最佳實踐
這裏有豐富的企業上雲最佳實踐,從典型場景入門,提供一系列項目實踐方案,降低企業上雲門檻的同時滿足您的需求!

場景描述

本方案適用於自然語言處理的訓練場景,使用神龍GPU雲服務器(SCCGN6)+CPFS+容器服務Kubernetes版(ACK)進行NLP的訓練,採用Bert模型,使用飛天AI加速訓練工具可以有效提升多機多卡的訓練效率。

解決問題

  • 使用神龍+ACK搭建NLP訓練環境
  • 使用SCC的RDMA網絡
  • 使用CPFS存儲訓練數據
  • 使用飛天AI加速訓練工具加速訓練

產品列表

  • 神龍GPU雲服務器(SCCGN6)
  • 容器服務Kubernetes版(ACK)
  • SCC超級計算集羣
  • CPFS共享存儲

bp_80

直達最佳實踐 》》

bp_80

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章