雖然PDF文件適合用於列印和發佈,但不適合所有類型的文檔。例如,包含複雜圖表和圖形的文檔可能無法在PDF中呈現得很好。但是HTML文件可以在任何可運行瀏覽器的電腦上進行閱讀並顯示。並且HTML還具有占用伺服器資源較小,便於搜索引擎收錄的特點。那麼今天這篇文章就將展示如何通過Java應用程式將PDF ...
雖然PDF文件適合用於列印和發佈,但不適合所有類型的文檔。例如,包含複雜圖表和圖形的文檔可能無法在PDF中呈現得很好。但是HTML文件可以在任何可運行瀏覽器的電腦上進行閱讀並顯示。並且HTML還具有占用伺服器資源較小,便於搜索引擎收錄的特點。那麼今天這篇文章就將展示如何通過Java應用程式將PDF文檔轉為HTML格式。下麵是我整理的具體步驟及方法,並附上Java代碼供大家參考。
- 將PDF文檔轉換為HTML文件
- 將PDF文檔轉換為嵌入SVG的HTML文件
- 將PDF文檔轉換為HTML流
代碼編譯環境:
IntelliJ IDEA 2019(jdk 1.8.0)
PDF Jar包:Free Spire.PDF for Java 5.1.0
引入jar包
導入方法1:
手動引入。將Free Spire.PDF for Java下載到本地,解壓,找到lib文件夾下的Spire.PDF.jar文件。在IDEA中打開如下界面,將本地路徑中的jar文件引入Java程式:
導入方法2:如果您想通過 Maven安裝,則可以在 pom.xml 文件中添加以下代碼導入 JAR 文件。
<repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-iceblue.cn/repository/maven-public/</url> </repository> </repositories> <dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.pdf.free</artifactId> <version>5.1.0</version> </dependency> </dependencies>
將PDF文檔轉換為HTML文件
我們可以使用 PdfDocument.saveToFile(String filename, FileFormat.HTML) 方法,可以直接將PDF文檔轉換為HTML文件。具體步驟如下。
- 創建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法載入PDF文件。
- 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。
完整代碼
Java
import com.spire.pdf.*; public class convertPDFToHTML { public static void main(String[] args) { //創建PdfDocument的對象 PdfDocument pdf = new PdfDocument(); //載入PDF文件 pdf.loadFromFile("鬱金香.pdf"); //將PDF文件保存為HTML文件 pdf.saveToFile("PDFToHTML.html",FileFormat.HTML); pdf.close(); } }
將PDF文檔轉換為嵌入SVG的HTML文件
PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法,可以在轉換時嵌入SVG。將PDF文件轉換為嵌入SVG的HTML文件的詳細步驟如下。
- 創建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法載入PDF文件。
- 使用PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法啟用嵌入SVG。
- 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。
完整代碼
Java
import com.spire.pdf.*; public class convertPDFToHTMLEmbeddingSVG { public static void main(String[] args) { //創建PdfDocument的對象 PdfDocument doc = new PdfDocument(); //載入PDF文件 doc.loadFromFile("鬱金香.pdf"); //設置嵌入SVG doc.getConvertOptions().setPdfToHtmlOptions(true); //將PDF文件另存為HTML文件 doc.saveToFile("PDFToHTMLEmbeddingSVG.html", FileFormat.HTML); doc.close(); } }
將PDF文檔轉換為HTML流
Free Spire.PDF for Java還支持將PDF文檔轉換為HTML流。具體步驟如下。
- 創建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法載入PDF文件。
- 使用PdfDocument.saveToStream() 方法將PDF文件保存為HTML流。
完整代碼
Java
import com.spire.pdf.*; import java.io.*; public class convertPDFToHTMLStream { public static void main(String[] args) throws FileNotFoundException { //創建PdfDocument的對象 PdfDocument pdf = new PdfDocument(); //載入PDF文件 pdf.loadFromFile("鬱金香.pdf"); //將PDF文件另存為HTML流 File outFile = new File("PDFToHTMLStream.html"); OutputStream outputStream = new FileOutputStream(outFile); pdf.saveToStream(outputStream, FileFormat.HTML); pdf.close(); } }
效果圖
—本文完—