概述 Python處理PDF文件需要安裝相應的庫: 【PyPDF2】庫 使用場景 工作中可能會涉及處理pdf文件,PyPDF2就是這樣一個庫, 使用它可以輕鬆的處理 pdf 文件,它提供了 讀、寫、分割、合併、文件轉換 等多種操作。 安裝庫 "網站" 使用說明 PyPDF2 "官方文檔(docume ...
概述
Python處理PDF文件需要安裝相應的庫:【PyPDF2】庫
使用場景
工作中可能會涉及處理pdf文件,PyPDF2就是這樣一個庫, 使用它可以輕鬆的處理 pdf 文件,它提供了讀、寫、分割、合併、文件轉換等多種操作。
安裝庫
使用說明
PyPDF2 官方文檔(documentation)
學習網站
博客
# 導入相關類
from PyPDF2 import PdfFileReader, PdfFileWriter
# 定義輸入文件和輸出文件(路徑)
inputFile = 'read.pdf'
outputFile = 'write.pdf'
# 獲取一個 PdfFileReader 對象
pdfReader = PdfFileReader(open(inputFile, 'rb'))
# 獲取 PDF 的頁數
pageCount = pdfReader.getNumPages()
print(pageCount)
# 返回一個 PageObject
page = pdfReader.getPage(i)
# 獲取一個 PdfFileWriter 對象
pdfWriter = PdfFileWriter()
# 將一個 PageObject 加入到 PdfFileWriter 中
pdfWriter.addPage(page)
# 輸出到文件中
pdfWriter.write(open(outputFile, 'wb'))
GitHub
提供了使用案例,當我們使用的時候再具體查看。