作用:處理PDF文檔
提取文本,旋轉頁面,疊加頁面
1.pdfFileObj = open('meetingminutes.pdf','rb')#打開pdf文檔
2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#獲取pdf文檔數據
3.pdfReader.numPages#獲取頁數
4.pageObj = pdfReader.getPage(0)#獲取指定頁碼的內容,從0開始
5.pageObj.extractText()#返回該頁文本的字符串 注:難以做到全部提取
6.pageObj.rotateClockwise(90)#旋轉頁面。只能旋轉90*x度
7.pageObj.mergePage(pdfReader.getPage(1))#將兩頁重疊
解密
1.pdfReader.isEncrypted#判斷文檔是否加密
2.pdfReader.decrypt('rosebud')#對加密的文檔進行解密
加密
1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter對象
pdfwriter.encrypt('sdsd')#加密
新建
1.無法世界添加內容,只能從其他pdf文檔中拷貝過來加入
eg:
import PyPDF2
pdfFile = open('meetingminutes.pdf','rb')#打開一個現有的文檔
pdfReader = PyPDF2.PdfFileReader(pdfFile)#獲取內容
pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter對象
for pageNum in range(pdfReader.numPages):#向PdfFileWriter對象中添加內容
pageObj = pdfReader.getPage(pageNum)
pdfwriter.addPage(pageObj)
pdfOutputFile = open('newFile.pdf','wb')#新建一個pdf文檔
pdfwriter.write(pdfOutputFile)#向文檔中寫入內容
pdfOutputFile.close()