Python 實現Word轉HTML

將Word轉換爲HTML能將文檔內容發佈在網頁上,這樣,用戶就可以通過瀏覽器直接查看或閱讀文檔而無需安裝特定的軟件。Word轉HTML對於在線發佈信息、創建在線文檔庫以及構建交互式網頁應用程序都非常有用。以下是使用Python將Word轉換爲HTML網頁的攻略,包含兩個示例。

  • 使用Python 將Word Doc/Docx轉爲HTML格式
  • 使用Python 將Word轉爲HTML並嵌入CSS樣式、圖片等

 

在進行該轉換操作前,需要先安裝Spire.Doc for Python庫。它是一款專業的Python Word 開發組件,可輕鬆實現 Word 文檔的創建、讀取、編輯和轉換等功能。

產品安裝pip 命令:

 

pip install Spire.Doc

 

 

用Python 將Word Doc/Docx轉爲HTML格式

第一個示例是一個特別簡單的轉換方法,僅需加載一個 .doc或 .docx文檔,然後使用 Document.SaveToFile(fileName string, FileFormat.Html) 方法就能將Word文檔另存爲HTML格式。代碼如下:

from spire.doc import *
from spire.doc.common import *
     
# 創建Document對象
document = Document()
 
# 加載一個doc或docx文檔 
document.LoadFromFile("財務報告.docx")
 
# 保存爲HTML文件
document.SaveToFile("Word轉Html.html", FileFormat.Html)
document.Close()

效果圖:

 

用Python 將Word轉爲HTML並嵌入CSS樣式、圖片等

如果在轉換時想要嵌入特定的CSS樣式,如內部樣式 Internal外部樣式 External,或者需要嵌入圖片等,可以用Spire.Doc for Python 提供的 HtmlExportOptions 類。代碼如下:

from spire.doc import *
from spire.doc.common import *
 
# 創建Document對象
document = Document()
 
# 加載Word文檔
document.LoadFromFile("財務報告.docx")
 
# 嵌入CSS樣式
document.HtmlExportOptions.CssStyleSheetFileName = "sample.css"
document.HtmlExportOptions.CssStyleSheetType = CssStyleSheetType.External
 
# 設置是否嵌入圖像
document.HtmlExportOptions.ImageEmbedded = False
document.HtmlExportOptions.ImagesPath = "Images/"
 
# 設置是否將表單字段導出爲純文本
document.HtmlExportOptions.IsTextInputFormFieldAsText = True
 
# 將文檔保存爲 html 文件
document.SaveToFile("轉Html.html", FileFormat.Html)
document.Close()

 


 

參考文章:

Python Word庫更多功能示例

如何在 VS Code中安裝 Spire.Doc for Python

 

 

用Python 將Word Doc/Docx轉爲HTML格式

用Python 將Word轉爲HTML並嵌入CSS樣式、圖片等

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章