注意Pytorch中GPU與CPU的使用

原創

2020-06-30 20:14

其實在Pytorch中並不是在任何情況下把數據放到GPU下就能訓練效率，減少訓練時間。

下面舉個例子：

import torch
import time

print(torch.cuda.is_available())

print(torch.cuda.current_device())



###CPU
start_time = time.time()
a = torch.ones(5,5)
for _ in range(1000000):
    a += a
elapsed_time = time.time() - start_time

print('CPU time = ',elapsed_time)

###GPU
start_time = time.time()
b = torch.ones(5,5).cuda()
for _ in range(1000000):
    b += b
elapsed_time = time.time() - start_time

print('GPU time = ',elapsed_time)

運行結果：

True
0
CPU time = 1.8500258922576904
GPU time = 8.387852907180786

Process finished with exit code 0

可以看出CPU運行的速度比GPU快很多，這是什麼原因呢?

其實，這是由於GPU加速通過大量的計算並行化來工作.即使同步計算，然而在上面的例子同步計算只有矩陣中25個元素，對於for循環而言，必須知道前一個時候值才能進行下一時刻值的計算，所以並不能實現並行計算。

但是如果改變張量的大小,事情會發生變化,那麼PyTorch能夠並行化更多的整體計算.我將迭代更改爲500的值,結果如下：

True
0
CPU time = 22.1019504070282
GPU time = 86.17750453948975

Process finished with exit code 0

可以看出當爲當爲5×5的時候CPU爲GPU的大約4.5倍，當爲500×500時只有3.89倍，這裏可以更改爲更大的值你就會發現GPU的效果了，所以以後知道什麼時候用CPU,什麼時候用GPU了吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

OpenAI發佈Triton，一款用於神經網絡的類Python GPU開源編程語言

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-09-03 17:58:55

GPU在計算機架構的新黃金時代還會繼續閃耀嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-09-02 10:33:55

Facebook推出數據並行訓練算法FSDP：採用更少的GPU，更高效地訓練更大數量級的模型

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Facebook工程团队

2021-08-13 09:34:06

突發！美商務部將7箇中國超算實體列入實體清單，制裁或許沒有華爲嚴重

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-04-09 12:03:54

FPGA在深度學習應用中或將取代GPU

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2020-12-08 09:03:57

性能提升最高達25倍！新型分佈式機器學習訓練加速方案RAT技術解讀

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2020-11-24 08:03:51

GPU選購指南：訓練ML模型，我必須買RTX3080嗎？

深度學習是一個計算要求非常高的領域，你對GPU的選擇將從根本上決定你的深度學習體驗。但是，如果你想購買一塊新GPU，主要看哪些特性呢？GPU內存、內核、張量核？如何做出有成本效益的選擇？這篇文章將深入研究這些問題，消除常見的誤解，讓你對如

2020-10-09 09:23:53

超級計算集羣結合ACK實現NLP訓練

阿里雲最佳實踐頻道：【點擊查看更多上雲最佳實踐】這裏有豐富的企業上雲最佳實踐，從典型場景入門，提供一系列項目實踐方案，降低企業上雲門檻的同時滿足您的需求！場景描述本方案適用於自然語言處理的訓練場景，使用神龍GPU雲服務器（SCCGN

最佳實踐小文

2020-09-22 10:04:53

用盡每一寸GPU，阿里雲cGPU容器技術白皮書重磅發佈！

背景雲原生已經成爲業內雲服務的一個趨勢。在雲原生上支持異構計算，這個功能在標準的Docker上已經可以很好的支持了。爲了進一步提高GPU的利用率、避免算力浪費，需要在單個GPU上可以運行多個容器，並且在多個容器間隔離GPU應用，這在標準的

雲棲號資訊小哥

2020-09-21 16:55:50

終下決心！中國龍芯決定放棄所有美國技術，做真正的純國產指令集

龍芯是近年來國產自主程度相對較高的芯片，曾支撐 2015 年中國發射的北斗衛星，如今宣佈放棄所有美國技術，轉而研發一套完全採用中國技術的指令集 LoongArch，離自主可控更進一步。龍芯決定放棄所有美國技術長期以來，除了在芯片代工方面

2020-08-26 13:43:59

英特爾前僱員講述：50年老廠是如何走上“擠牙膏”之路的？

最近，英特爾決定將芯片製造外包，由於其未來CPU將採用的7nm芯片，技術進度較目標落後約12個月。對此，很多人表示意料之中。彭博社評論稱，此舉預示着一個由英特爾公司和美國主導世界半導體行業的時代的終結。在英特爾首席執行官鮑勃·斯旺（Bo

2020-08-17 15:58:55

FPGA 的歷史、現狀和未來

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！ FPGA（現場可編程門陣列，Field-Programmable Gate Arrays) 自誕生以來，就與 ASIC 社區糾纏不清。上世紀

雲棲號資訊小哥

2020-07-31 14:52:55

MNIST數據集手寫數字識別

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

Linux 安裝Nvidia GPU顯卡驅動

文章目錄安裝Nvidia GPU驅動什麼是nouveau驅動？Centos7.7安裝Nvidia GPU驅動Ubuntu 18.04安裝Nvidia GPU驅動準備工作開始安裝安裝cuda檢測NVIDIA驅動是否成功安裝集顯與獨顯

2020-07-07 23:16:19

關於Texture Cache簡單總結

Texture Cache是一個存儲圖片數據的只讀cache 按照正常uv順序讀貼圖tex cache有高命中率 Texture Cache在 shader processor附近，所以它有高吞吐率，並且低延遲上圖可見有許多 shad

2020-07-07 12:30:42

24小時熱門文章

最新文章

最新評論文章