上次講到,要快速提取word與excel文件中的圖片,有一個前提條件,那就是操作的目標文件擴展名必須是要爲.docx\.xlsx纔可以。這次我們用Python 3來實現.doc\.xls文件自動轉換爲.docx\.xlsx。
Python 3實現代碼
import win32com.client as win32 # 引入win32com庫(win32com功能強大,可以操作word、調用宏等等等)
import os # 引入os庫(文件及目錄操作)
#自定義xls轉xlsx功能函數
def xls_xlsx(fname):
excel = win32.gencache.EnsureDispatch('Excel.Application')
xls = excel.Workbooks.Open(fname) # 目標路徑下的文件
xls.SaveAs(fname+'x', FileFormat = 51) #51爲xlsx 56爲xls
xls.Close() #關閉資源
excel.Application.Quit() #退出Excel
os.remove(fname) #刪除原Excel文件
#自定義doc轉docx功能函數
def doc_docx(fname):
word = win32.Dispatch('Word.Application')
doc = word.Documents.Open(fname) # 目標路徑下的文件
doc.SaveAs(fname+'x', 16) # 16爲xlsx文件格式
doc.Close() #關閉資源
word.Quit() #退出word
os.remove(fname) #刪除原Word文件
if __name__=="__main__": #主程序入口
xls_xlsx('xx\xx\xx.xls') #調用xlsx轉換函數
doc_docx('xx\xx\xx.doc') #調用docx轉換函
以上是功能實現的Pyhton 3源代碼,感興趣的小夥伴可以自己動手嘗試一下。