python 操作Excel
本文藉此機會,記錄使用python 讀寫excel 的過程。
相關資料
全局概述
xlsxwriter
只支持寫,可以寫大量數據,行數最多達到1,000,000以上,列數最多超過16,000。
支持大量數據的寫法:
workbook = xlsxwriter.Workbook(filename, {'constant_memory': True})
openpyxl
支持讀寫,讀寫速度一般,行數越多越慢,行上限65536,列上限256.
有讀和寫優化,優化效果一般,如果用優化寫法需要用append一行內容。
optimized read :
from openpyxl import load_workbook
wb = load_workbook(filename='large_file.xlsx', read_only=True)
ws = wb['big_data'] # ws is now an IterableWorksheet
for row in ws.rows:
for cell in row:
print(cell.value)
optimized writer
>> from openpyxl import Workbook >> wb = Workbook(write_only=True) >> ws = wb.create_sheet() >> >> # now we'll fill it with 100 rows x 200 columns >> >> for irow in range(100): ... ws.append(['%d' % i for i in range(200)]) >> # save the file >> wb.save('new_big_file.xlsx')
or
>>> from openpyxl import Workbook
>>> wb = Workbook(optimized_write = True)
>>> ws = wb.create_sheet()
>>> from openpyxl.writer.dump_worksheet import WriteOnlyCell
>>> from openpyxl.comments import Comment
>>> from openpyxl.styles import Style, Font
>>> cell = WriteOnlyCell(ws, value="hello world")
>>> cell.font = Font(name='Courrier', size=36)
>>> cell.comment = Comment(text="A comment", author="Author's Name")
xlrd
支持xlsx,xls,只可以讀,操作容易,行列受限,同openpyxl
xlwt
支持xls,只可以寫,操作容易,配合xlrd,行列受限。
實驗結果:
對比測試,
- openpyxl 讀寫
- openpyxl讀,xlsxwriter寫
- xlrd讀,xlsxwriter寫
綜上比較,前兩者性能相似如下:
N表示行數,列數固定採用40列,進行從一個excel讀,寫到另一個excel.
N=100 -> 35s
N=200 -> 2m05s
N=500 ->12m05s
N=4000 ->數小時
採用xlrd和xlsxwriter讀寫:
xlrd加載4000行需要1m20s。(主要慢在加載excel上,load)
N=2000 -> 1m 15s
N=4000 -> 2m39s
這是什麼差距,OMG。就寫到這裏,回去睡覺了。稍後附上程序。