步驟:
- 安裝 PyPDF2 庫。
- 使用 PyPDF2 庫打開 PDF 文件。
- 使用 PyPDF2 庫讀取 PDF 文件中的文本。
- 使用 PyPDF2 庫讀取 PDF 文件中的圖像。
- 創建一個新的 Word 文檔。
- 將 PDF 文件中的文本和圖像添加到新的 Word 文檔中。
- 保存新的 Word 文件。
以下是使用 PyPDF2 庫從 PDF 文件中讀取文本和圖像並生成新的 Word 文件的示例代碼:
import PyPDF2
# 打開 PDF 文件
pdf = PyPDF2.PdfFileReader("my_pdf.pdf")
# 讀取 PDF 文件中的文本
text = pdf.getPage(0).extractText()
# 讀取 PDF 文件中的圖像
images = pdf.getPage(0).getImages()
# 創建一個新的 Word 文檔
word = Document()
# 將 PDF 文件中的文本和圖像添加到新的 Word 文檔中
word.add_paragraph(text)
for image in images:
word.add_picture(image)
# 保存新的 Word 文檔
word.save("my_word_document.docx")