python-PyPDF2

作用:處理PDF文檔

提取文本,旋轉頁面,疊加頁面

1.pdfFileObj = open('meetingminutes.pdf','rb')#打開pdf文檔

2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#獲取pdf文檔數據

3.pdfReader.numPages#獲取頁數

4.pageObj = pdfReader.getPage(0)#獲取指定頁碼的內容,從0開始

5.pageObj.extractText()#返回該頁文本的字符串 注:難以做到全部提取

6.pageObj.rotateClockwise(90)#旋轉頁面。只能旋轉90*x度

7.pageObj.mergePage(pdfReader.getPage(1))#將兩頁重疊

  

  

解密

1.pdfReader.isEncrypted#判斷文檔是否加密

2.pdfReader.decrypt('rosebud')#對加密的文檔進行解密

加密

1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter對象

    pdfwriter.encrypt('sdsd')#加密

新建

1.無法世界添加內容,只能從其他pdf文檔中拷貝過來加入

eg:

import PyPDF2

pdfFile = open('meetingminutes.pdf','rb')#打開一個現有的文檔

pdfReader = PyPDF2.PdfFileReader(pdfFile)#獲取內容

pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter對象

for pageNum in range(pdfReader.numPages):#向PdfFileWriter對象中添加內容

    pageObj = pdfReader.getPage(pageNum)

    pdfwriter.addPage(pageObj)

pdfOutputFile = open('newFile.pdf','wb')#新建一個pdf文檔

pdfwriter.write(pdfOutputFile)#向文檔中寫入內容

pdfOutputFile.close()


注:所有的修改操作均無法再原文件上操作,只能將修改結果寫入新文件中





發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章