詳細介紹Python進度條tqdm的使用
有時候在使用Python處理比較耗時操作的時候,爲了便於觀察處理進度,這時候就需要通過進度條將處理情況進行可視化展示,以便我們能夠及時瞭解情況。這對於第三方庫非常豐富的Python來說,想要實現這一功能並不是什麼難事。
tqdm
就能非常完美的支持和解決這些問題,可以實時輸出處理進度而且佔用的CPU資源非常少
,支持windows
、Linux
、mac
等系統,支持循環處理
、多進程
、遞歸處理
、還可以結合linux
的命令來查看處理情況,等進度展示。
大家先看看tqdm的進度條效果:
安裝
github地址:https://github.com/tqdm/tqdm
想要安裝tqdm
也是非常簡單的,通過pip或conda就可以安裝,而且不需要安裝其他的依賴庫
pip安裝
pip install tqdm
conda安裝
conda install -c conda-forge tqdm
迭代對象處理
對於可以迭代的對象
都可以使用下面這種方式,來實現可視化進度,非常方便
from tqdm import tqdm
import time
for i in tqdm(range(100)):
time.sleep(0.1)
pass
在使用tqdm
的時候,可以將tqdm(range(100))
替換爲trange(100)
代碼如下
from tqdm import tqdm,trange
import time
for i in trange(100):
time.sleep(0.1)
pass
觀察處理的數據
通過tqdm
提供的set_description
方法可以實時查看每次處理的數據
from tqdm import tqdm
import time
pbar = tqdm(["a","b","c","d"])
for c in pbar:
time.sleep(1)
pbar.set_description("Processing %s"%c)
手動設置處理的進度
通過update
方法可以控制每次進度條更新的進度
from tqdm import tqdm
import time
#total參數設置進度條的總長度
with tqdm(total=100) as pbar:
for i in range(100):
time.sleep(0.05)
#每次更新進度條的長度
pbar.update(1)
除了使用with
之外,還可以使用另外一種方法實現上面的效果
from tqdm import tqdm
import time
#total參數設置進度條的總長度
pbar = tqdm(total=100)
for i in range(100):
time.sleep(0.05)
#每次更新進度條的長度
pbar.update(1)
#關閉佔用的資源
pbar.close()
linux命令展示進度條
不使用tqdm
$ time find . -name '*.py' -type f -exec cat \{} \; | wc -l
857365
real 0m3.458s
user 0m0.274s
sys 0m3.325s
使用tqdm
$ time find . -name '*.py' -type f -exec cat \{} \; | tqdm | wc -l
857366it [00:03, 246471.31it/s]
857365
real 0m3.585s
user 0m0.862s
sys 0m3.358s
指定tqdm的參數控制進度條
$ find . -name '*.py' -type f -exec cat \{} \; |
tqdm --unit loc --unit_scale --total 857366 >> /dev/null
100%|███████████████████████████████████| 857K/857K [00:04<00:00, 246Kloc/s]
$ 7z a -bd -r backup.7z docs/ | grep Compressing |
tqdm --total $(find docs/ -type f | wc -l) --unit files >> backup.log
100%|███████████████████████████████▉| 8014/8014 [01:37<00:00, 82.29files/s]
自定義進度條顯示信息
通過set_description
和set_postfix
方法設置進度條顯示信息
from tqdm import trange
from random import random,randint
import time
with trange(100) as t:
for i in t:
#設置進度條左邊顯示的信息
t.set_description("GEN %i"%i)
#設置進度條右邊顯示的信息
t.set_postfix(loss=random(),gen=randint(1,999),str="h",lst=[1,2])
time.sleep(0.1)
from tqdm import tqdm
import time
with tqdm(total=10,bar_format="{postfix[0]}{postfix[1][value]:>9.3g}", postfix=["Batch",dict(value=0)]) as t:
for i in range(10):
time.sleep(0.05)
t.postfix[1]["value"] = i / 2
t.update()
多層循環進度條
通過tqdm
也可以很簡單的實現嵌套循環進度條的展示
from tqdm import tqdm
import time
for i in tqdm(range(20), ascii=True,desc="1st loop"):
for j in tqdm(range(10), ascii=True,desc="2nd loop"):
time.sleep(0.01)
在pycharm
中執行以上代碼的時候,會出現進度條位置錯亂,目前官方並沒有給出好的解決方案,這是由於pycharm不支持某些字符導致的,不過可以將上面的代碼保存爲腳本然後在命令行中執行,效果如下
多進程進度條
在使用多進程處理任務的時候,通過tqdm可以實時查看每一個進程任務的處理情況
from time import sleep
from tqdm import trange, tqdm
from multiprocessing import Pool, freeze_support, RLock
L = list(range(9))
def progresser(n):
interval = 0.001 / (n + 2)
total = 5000
text = "#{}, est. {:<04.2}s".format(n, interval * total)
for i in trange(total, desc=text, position=n,ascii=True):
sleep(interval)
if __name__ == '__main__':
freeze_support() # for Windows support
p = Pool(len(L),
# again, for Windows support
initializer=tqdm.set_lock, initargs=(RLock(),))
p.map(progresser, L)
print("\n" * (len(L) - 2))
pandas中使用tqdm
import pandas as pd
import numpy as np
from tqdm import tqdm
df = pd.DataFrame(np.random.randint(0, 100, (100000, 6)))
tqdm.pandas(desc="my bar!")
df.progress_apply(lambda x: x**2)
遞歸使用進度條
from tqdm import tqdm
import os.path
def find_files_recursively(path, show_progress=True):
files = []
# total=1 assumes `path` is a file
t = tqdm(total=1, unit="file", disable=not show_progress)
if not os.path.exists(path):
raise IOError("Cannot find:" + path)
def append_found_file(f):
files.append(f)
t.update()
def list_found_dir(path):
"""returns os.listdir(path) assuming os.path.isdir(path)"""
try:
listing = os.listdir(path)
except:
return []
# subtract 1 since a "file" we found was actually this directory
t.total += len(listing) - 1
# fancy way to give info without forcing a refresh
t.set_postfix(dir=path[-10:], refresh=False)
t.update(0) # may trigger a refresh
return listing
def recursively_search(path):
if os.path.isdir(path):
for f in list_found_dir(path):
recursively_search(os.path.join(path, f))
else:
append_found_file(path)
recursively_search(path)
t.set_postfix(dir=path)
t.close()
return files
find_files_recursively("E:/")
注意
在使用tqdm
顯示進度條的時候,如果代碼中存在print
可能會導致輸出多行進度條,此時可以將print
語句改爲tqdm.write
,代碼如下
for i in tqdm(range(10),ascii=True):
tqdm.write("come on")
time.sleep(0.1)