原创 構建Tensorflow RDMA的Docker鏡像

RDMA是一個遠程通訊技術,它通過Kernel bypass等方式降低數據傳輸中的延遲和CPU消耗。在分佈式訓練中,由於多個Worker之間或者Worker和Paramater Server 之間需要大量傳輸模型變量。當GPU到達一定數量後