python 操作excel 讀寫文件

python 操作Excel

本文藉此機會,記錄使用python 讀寫excel 的過程。

相關資料

全局概述

xlsxwriter
只支持寫,可以寫大量數據,行數最多達到1,000,000以上,列數最多超過16,000。

支持大量數據的寫法

 workbook = xlsxwriter.Workbook(filename, {'constant_memory': True})

openpyxl
支持讀寫,讀寫速度一般,行數越多越慢,行上限65536,列上限256.
有讀和寫優化,優化效果一般,如果用優化寫法需要用append一行內容。

optimized read :

from openpyxl import load_workbook
wb = load_workbook(filename='large_file.xlsx', read_only=True)
ws = wb['big_data'] # ws is now an IterableWorksheet
for row in ws.rows:
for cell in row:
print(cell.value)


optimized writer

>> from openpyxl import Workbook
>> wb = Workbook(write_only=True)
>> ws = wb.create_sheet()
>>
>> # now we'll fill it with 100 rows x 200 columns
>>
>> for irow in range(100):
    ...     ws.append(['%d' % i for i in range(200)])
>> # save the file
>> wb.save('new_big_file.xlsx') 

or

>>> from openpyxl import Workbook
>>> wb = Workbook(optimized_write = True)
>>> ws = wb.create_sheet()
>>> from openpyxl.writer.dump_worksheet import WriteOnlyCell
>>> from openpyxl.comments import Comment
>>> from openpyxl.styles import Style, Font
>>> cell = WriteOnlyCell(ws, value="hello world")
>>> cell.font = Font(name='Courrier', size=36)
>>> cell.comment = Comment(text="A comment", author="Author's Name")

xlrd

支持xlsx,xls,只可以讀,操作容易,行列受限,同openpyxl

xlwt

支持xls,只可以寫,操作容易,配合xlrd,行列受限。

實驗結果:

對比測試,

  • openpyxl 讀寫
  • openpyxl讀,xlsxwriter寫
  • xlrd讀,xlsxwriter寫

綜上比較,前兩者性能相似如下:

N表示行數,列數固定採用40列,進行從一個excel讀,寫到另一個excel.
N=100 -> 35s
N=200 -> 2m05s
N=500 ->12m05s
N=4000 ->數小時

採用xlrd和xlsxwriter讀寫:

xlrd加載4000行需要1m20s。(主要慢在加載excel上,load)
N=2000 -> 1m 15s
N=4000 -> 2m39s

這是什麼差距,OMG。就寫到這裏,回去睡覺了。稍後附上程序。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章