Python:將Word轉成HTML

圖片在轉換結果中,會以Base64編碼的方式編碼。

前置條件:安裝pydocx

pip install pydocx

from pydocx import PyDocX
html = PyDocX.to_html("test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()

通過網頁上傳word文檔,只接收docx

<form method="post" enctype="multipart/form-data">
<input type="file" name="file" accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document">
</form>

windows下,將doc轉爲docx

pip3 install pypiwin32

from win32com import client
word = client.Dispatch("Word.Application")
doc = word.Documents.Open("D:\\***\\**.doc") //絕對路徑 doc文件
doc.SaveAs("D:\\***\\**.docx",16) //保存的docx 文件,絕對路徑
doc.Close()
word.Quit()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章