眾所周知,PDF文檔除了具有較強穩定性和相容性外, 還具有較強的安全性,在工作中可以有效避免別人無意中對文檔內容進行修改。但與此同時,也妨礙了對文檔的正常的修改。這時我們可以將PDF轉為Word文檔進行修改或再編輯。使用軟體將 PDF 文檔轉換為 Word 文檔十分簡單,然而要在轉換時保持佈局甚至字 ...
眾所周知,PDF文檔除了具有較強穩定性和相容性外, 還具有較強的安全性,在工作中可以有效避免別人無意中對文檔內容進行修改。但與此同時,也妨礙了對文檔的正常的修改。這時我們可以將PDF轉為Word文檔進行修改或再編輯。使用軟體將 PDF 文檔轉換為 Word 文檔十分簡單,然而要在轉換時保持佈局甚至字體格式卻並不容易。本文將分為以下兩部分介紹如何在保持佈局的情況下將PDF轉為Word文檔。
- 將 PDF 轉換為固定佈局的 Doc/Docx 文檔
- 將 PDF 轉換為流動形態的 Doc/Docx 文檔
固定佈局模式轉換速度快,有利於最大程度保持 PDF 文件的原貌。但是,生成的文檔的可編輯性將受到限制,因為 PDF 中的每一行文本將在生成的 Word 文檔中顯示在單獨的框架中。
流動形態是一種完整的識別模式。轉換後的內容不會以框架形式呈現,並且生成的文檔的結構是可流動的。生成的 Word 文檔很容易重新編輯,但看起來可能與原始 PDF 文件不同。
代碼編譯環境:
IntelliJ IDEA 2018(jdk 1.8.0)
PDF Jar包:Free Spire.PDF for Java 5.1.0
1.引入jar包
導入方法1:
手動引入。將Free Spire.PDF for Java下載到本地,解壓,找到lib文件夾下的Spire.PDF.jar文件。在IDEA中打開如下界面,將本地路徑中的jar文件引入Java程式:
導入方法2:如果您想通過 Maven安裝,則可以在 pom.xml 文件中添加以下代碼導入 JAR 文件
<repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-iceblue.cn/repository/maven-public/</url> </repository> </repositories> <dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.pdf.free</artifactId> <version>5.1.0</version> </dependency> </dependencies>
將 PDF 轉換為固定佈局的 Doc/Docx 文檔
- 以下是將 PDF 轉為固定佈局的Doc/Docx 文檔的具體步驟。
- 創建一個 PdfDocument 對象。
- 使用 PdfDocument.loadFromFile() 方法載入 PDF 文件。
- 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法將 PDF 文檔轉換為 Doc 或 Docx 格式文件。
完整代碼
Java
import com.spire.pdf.FileFormat; import com.spire.pdf.PdfDocument; public class ConvertPdfToWordWithFixedLayout { public static void main(String[] args) { //創建一個 PdfDocument 對象 PdfDocument doc = new PdfDocument(); //載入 PDF 文件 doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf"); //將PDF轉換為Doc格式文件並保存 doc.saveToFile("output/ToDoc.doc", FileFormat.DOC); //將PDF轉換為Docx格式文件並保存 doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX); doc.close(); } }
將 PDF 轉換為流動形態的 Doc/Docx 文檔
以下是將 PDF 轉換為流動形態的 Doc/Docx 文檔的具體步驟:
- 創建一個 PdfDocument 對象。
- 使用 PdfDocument.loadFromFile() 方法載入 PDF 文件。
- 使用 PdfDocument. getConvertOptions().setConvertToWordUsingFlow() 方法將轉換模式設置為流。
- 使用 PdfDocument.saveToFile(String fileName, FileFormat fileFormat) 方法將 PDF 文檔轉換為 Doc 或 Docx 格式文件。
完整代碼
Java
import com.spire.pdf.FileFormat; import com.spire.pdf.PdfDocument; public class ConvertPdfToWordWithFlowableStructure { public static void main(String[] args) { //創建一個 PdfDocument 對象 PdfDocument doc = new PdfDocument(); //載入 PDF 文件 doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf"); //將 PDF 轉換為流動形態的Word doc.getConvertOptions().setConvertToWordUsingFlow(true); //將PDF轉換為Doc格式文件並保存 doc.saveToFile("output/ToDoc.doc", FileFormat.DOC); //將PDF轉換為Docx格式文件並保存 doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX); doc.close(); } }
效果圖
—本文完—