怎麼用Java 高效提取、替換、刪除PDF文檔中的圖片

来源:https://www.cnblogs.com/coderjava/archive/2020/06/09/13080799.html
-Advertisement-
Play Games

使用工具:Free Spire.PDF for Java (免費版) Jar**文件獲取及導入: 方法1:通過官網下載獲取jar包。解壓後將lib文件夾下的Spire.Pdf.jar文件導入Java程式。(如下圖) 方法2:通過maven倉庫安裝導入。具體安裝詳解參見此網頁。 【示例1】提取PDF中 ...


使用工具Free Spire.PDF for Java (免費版)

Jar**文件獲取及導入:

方法1:通過官網下載獲取jar包。解壓後將lib文件夾下的Spire.Pdf.jar文件導入Java程式。(如下圖)

 

img

方法2:通過maven倉庫安裝導入。具體安裝詳解參見此網頁

 

【示例1】提取PDF中的圖片

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

import javax.imageio.ImageIO;

import com.spire.pdf.PdfDocument;

import com.spire.pdf.PdfPageBase;

public class ExtractPicture {

public static void main(String[] args) throws IOException {

 

創建PdfDocument實例

PdfDocument doc = new PdfDocument();

 

載入PDF文件

doc.loadFromFile("C:**\Users\Test1\Desktop\Sample.pdf"**);

int index = 0;

 

遍歷PDF文件中的頁面

for (PdfPageBase page : (Iterable) doc.getPages()) {

 

提取頁面中的圖片並保存至本地文件夾

for (BufferedImage image : page.extractImages()) {

File output =new File("C:*\Users\Test1\Desktop\ExtractPicture\"** + String.format*("Image_%d.png", index++));

ImageIO.write(image,"PNG", output);

}

}

}

}

 

圖片提取效果:

 

img

 

【示例2】替換PDF中的圖片

import com.spire.pdf.PdfDocument;

import com.spire.pdf.PdfPageBase;

import com.spire.pdf.graphics.PdfImage;

public class ReplaceImage {

public static void main(String[] args) {

 

載入PDF文檔

PdfDocument pdf =new PdfDocument();

pdf.loadFromFile("C:\Users\Test1\Desktop\Sample.pdf");

 

獲取第一頁

PdfPageBase page = pdf.getPages().get(0);

 

載入一張圖片

PdfImage image = PdfImage.fromFile("C:\Users\Test1\Desktop\Image.png");

 

使用載入的圖片替換第一頁上的第一張圖片

page.replaceImage(0, image);

 

保存文檔

pdf.saveToFile("output/ReplaceImage.pdf");

}

}

 

圖片替換效果:

 

img

 

【示例3】刪除PDF中的圖片

import com.spire.pdf.FileFormat;

import com.spire.pdf.PdfDocument;

import com.spire.pdf.PdfPageBase;

import com.spire.pdf.exporting.PdfImageInfo;

public class DeleteImage {

public static void main(String[] args) {

 

創建PdfDocument對象

PdfDocument doc =new PdfDocument();

 

載入PDF文檔

doc.loadFromFile("C:\Users\Test1\Desktop\Sample.pdf");

 

遍歷文檔每一頁

for (int i =0; i < doc.getPages().getCount(); i++) {

 

獲取特定頁

PdfPageBase page = doc.getPages().get(i);

 

獲取頁面上的圖片信息

PdfImageInfo[] imageInfo = page.getImagesInfo();

 

遍歷每一個圖片

for (int j = imageInfo.length; j >0; j--) {

 

通過圖片的索引刪除圖片

page.deleteImage(j -1);

}

}

 

保存文檔

doc.saveToFile("output/DeleteImages.pdf", FileFormat.PDF);

}

}

 

 

圖片刪除效果:

 

img

 

“大清亡於閉關鎖國,學習技術需要交流和資料”。 在這裡我給大家準備了很多的學習資料免費獲取,包括但不限於java進階學習資料、技術乾貨、大廠面試題系列、技術動向、職業生涯等一切有關程式員的分享.

java進階方法筆記,學習資料,面試題,電子書籍免費領取,讓你成為java大神,追到自己的女神,走向人生巔峰


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. Elasticsearch簡介 Elasticsearch是一個基於Lucene的搜索伺服器。它提供了一個分散式多用戶能力的全文搜索引擎,基於RESTful web介面。Elasticsearch是用Java語言開發的,並作為Apache許可條款下的開放源碼發佈,是一種流行的企業級搜索引擎。E ...
  • 1. 配置本地已經安裝好的Maven windows下的preference,點擊Maven>Installations,點擊add 選擇安裝的目錄 點擊finish完成 2.更改配置文件地址,其中第二個不做修改也可以 3.創建Maven項目,File>New>others,選擇Maven 4. 5 ...
  • 原作:Jake Edge 譯者:豌豆花下貓@Python貓 英文:https://lwn.net/Articles/819853/ 隨著 Python 3.9.0b1 的發佈,即開發周期中計劃的四個 beta 版本的首個,Python 3.9 的功能已經是完善了。在 10 月發佈最終版本之前,還會有 ...
  • 引言 考慮下麵的結構體定義: 假設這個結構體的成員在記憶體中是緊湊排列的,且c1的起始地址是0,則s的地址就是1,c2的地址是3,i的地址是4。 現在,我們編寫一個簡單的程式: 運行後輸出: 為什麼會這樣?這就是位元組對齊導致的問題。 本文在參考諸多資料的基礎上,詳細介紹常見的位元組對齊問題。因成文較早, ...
  • 1.去官網下載解壓文件 https://maven.apache.org/download.cgi# 上面的是windows的安裝包,下麵的Windows系統的maven源碼,點擊上面的下載。 2.下載完成後,將下載下來的文件進行解壓,註意:解壓目錄不要含有空格和中文 3.找到conf下的setti ...
  • 1、裝飾器: 定義:本質是函數,用於裝飾其他函數:就是為其他函數添加附加功能。 原則:1.不能修改被裝飾的函數的源代碼 2.不能修改被裝飾的函數的調用方式 2、實現裝飾器知識儲備: 1). 函數即“變數” #大樓房間-門牌號 -->記憶體釋放機制 2). 高階函數 a: 把一個函數名當作實參傳給另一個 ...
  • 作為一個Java後端程式員(或準備成為Java後端程式員),對Tomcat一定要熟悉。 雖然大多數時候Tomcat都是運行在Linux伺服器上的。 但是日常本地開發和調試時免不了要在我們的Windows電腦上安裝一個Tomcat。 這篇文章就記錄下安裝Tomcat的操作,和遇到的一些小坑吧。 第一步 ...
  • 本篇為快速複習C語言系列之第二篇:格式化輸入與輸出。由於是複習用,所以並非針對完全零基礎的同學。當然,有其他編程底子的同學是可以的。 本篇著重講述 printf() 和 scanf() 。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...