記使用pdf.js過程遇到的坑_ZenDei技術網路在線

記使用pdf.js過程遇到的坑

-Advertisement-

最近項目中需要用到js庫來渲染pdf文件，調研後發現無論是reach-pdf.js或者是svelte-pdf.js都是在pdf.js基礎上做了些許精簡，反而功能還不如原始的pdf.js來得全面。但是原始的庫幾乎沒有像樣的代碼示例，而能搜索到的大多數代碼不少都是十幾年前的了，在這個過程中踩了不少坑，做 ...

最近項目中需要用到js庫來渲染pdf文件，調研後發現無論是reach-pdf.js或者是svelte-pdf.js都是在pdf.js基礎上做了些許精簡，反而功能還不如原始的pdf.js來得全面。但是原始的庫幾乎沒有像樣的代碼示例，而能搜索到的大多數代碼不少都是十幾年前的了，在這個過程中踩了不少坑，做個記錄，希望對看到的人有所幫助。

使用npm安裝pdfjs-dist庫（也可以直接下載源碼並引入）

npm install pdfjs-dist

導入庫

// 網上很多代碼都是import xxx from 'pdfjs-dist';
// 而xxx一般都是過期或者不存在的，直接把所有導出為pdfjslib即可
import * as pdfjslib from 'pdfjs-dist';
// 註意需要設置這個參數
pdfjslib.GlobalWorkerOptions.workerSrc = 'node_modules/pdfjs-dist/build/pdf.worker.js';

單頁渲染，多頁渲染在下麵代碼基礎上直接添加一個迴圈即可

let src = 'xxx.pdf';
let pageNum = 1;
let scale_ratio = 1.5;

async function renderPage() {
    const pdf = await pdfjsLib.getDocument(src).promise;
    const page = await pdf.getPage(pageNum);
    const viewport = page.getViewport({ scale: scale_ratio });

    const canvas = document.createElement('canvas');
    const context = canvas.getContext('2d');

    canvas.height = viewport.height;
    canvas.width = viewport.width;

    const renderContext = {
      canvasContext: context,
      viewport: viewport
    };
    await page.render(renderContext);

  }

註意渲染完的pdf只有圖片形式，使用開發者工具看網頁的結構只有canvas組件，想要實現文字的選擇和複製還需要在上面渲染一層文字層。

// 需要引入樣式文件，不然文字不會懸浮在cavas組件上
import 'pdfjs-dist/web/pdf_viewer.css';

async function renderFullPage(){
        const pdf = await pdfjsLib.getDocument(src).promise;

        const pdfContainer = document.createElement('div');
        pdfContainer.style.setProperty('--scale-factor', scale_ratio);

        for (let i=1; i<=pdf.numPages; i++){
            const pageNumber = i;
            const page = await pdf.getPage(pageNumber);

            const viewport = page.getViewport({scale: scale_ratio});

            const canvas = document.createElement('canvas');
            const context = canvas.getContext('2d');

            canvas.height = viewport.height ;
            canvas.width = viewport.width ;
            
            const renderContext = {
                canvasContext: context,
                viewport: viewport
            };
        
            await page.render(renderContext);

            // canvasWrapper 可加可不加
            const canvasWrapper = document.createElement('div');
            canvasWrapper.className = 'canvasWrapper';
            canvasWrapper.appendChild(canvas);

            const textContent = await page.getTextContent();
            const textLayerDiv = document.createElement('div');
            // 類名嚴格為：textLayer
            textLayerDiv.className = `textLayer`;

            pdfjsLib.renderTextLayer({
                textContentSource: textContent,
                container: textLayerDiv,
                viewport: viewport,
                textDivs: []
            });
            
            const pageDiv = document.createElement('div');
            pageDiv.className = 'page';
            // 需要設置 position: relative
            // 否則全部文字可能都擠在第一頁
            pageDiv.style = "position: relative; margin-bottom:10px";

            pageDiv.appendChild(canvasWrapper);
            pageDiv.appendChild(textLayerDiv);
            
            pdfContainer.appendChild(pageDiv);
            
        }

    }

簡單來說就是在渲染完canvas代碼之後，再渲染出文字層。有幾個註意點：

需要在開頭引入樣式表，不然文字層會實際顯示在頁面中，不會懸浮不會透明；
需要在外面的組件中設置參數--scale-factor，用於保證圖片和文字的位置對應，否則調整了scale_ratio後圖片尺寸改變，但是文字層的大小還是不變；
文字層的類名需要嚴格設置為textLayer，從開頭引入的樣式表中可以看到；
包含canvas和文字層的父組件需要設置style為position: relative，否則多頁的文字都會渲染到第一頁中。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

AutoMySQLBackup加密備份解密問題淺析

AutoMySQLBackup備份配置了加密選項過後，它會將資料庫的備份文件加密。測試解密這些加密的備份文件時遇到錯誤(密鑰做了脫敏處理)。 $ openssl enc -aes-256-cbc -d -in daily_mysql_2024-05-14_09h09m_Tuesday.sql.gz. ...
JDBC連接openGauss6.0和PostgreSQL16.2性能對比

本文分享自華為雲社區《JDBC連接openGauss6.0和PostgreSQL16.2性能對比》，作者： Gauss松鼠會小助手。 PostgreSQL vs openGauss 01 前置準備安裝JDK：詳細安裝步驟請問度娘，輸入能正常返回即已安裝 [root@db06 ~]# java - ...
鴻蒙HarmonyOS實戰-Stage模型（服務卡片介紹和運行機制）

一、服務卡片介紹 1.服務卡片的概念在HarmonyOS中，服務卡片是一種提供即時信息和快速操作的小組件，類似於Android中的通知欄。服務卡片可以顯示各種類型的信息，包括通知、天氣、日曆事件、音樂播放器、快捷方式等。用戶可以根據自己的需求配置服務卡片，並通過輕掃或點擊來查看詳細信息或執 ...
鴻蒙HarmonyOS實戰-Stage模型（ExtensionAbility組件）

一、ExtensionAbility組件 1.概念 HarmonyOS中的ExtensionAbility組件是一種能夠擴展系統功能的能力組件。它可以通過擴展系統能力介面，為應用程式提供一些特定的功能，以滿足應用程式的特殊需求。 ExtensionAbility組件的特點包括：系統組件：E ...
鴻蒙HarmonyOS實戰-Stage模型（UIAbility組件）

一、UIAbility組件 1.概述 HarmonyOS中的Stage模型是一種基於UIAbility組件的應用程式架構。UIAbility是HarmonyOS系統中用於構建用戶界面的基本組件之一。它負責處理應用程式界面的顯示和交互。在Stage模型中，每個應用程式都有一個或多個Stage ...
蘋果開發者是否審核歧視中國開發者？傲慢無恥的蘋果公司

說來慚愧，作為差不多10年的開發者，第一次嘗試提審，結果卻收穫來了蘋果無休止的等待我從4月24日替身，後續到現在沒有任何回饋，只告訴你 other 原因拒絕，請問蘋果是只針對中國開發者，還是所有開發者？如果一個賬戶按年計費，一次等待按照一個月起算，耽誤多少開發者的時間和金錢。我知道蘋果一向傲 ...
我為什麼還要造一個前端輪子？

有時候，我們需要在網頁判斷用戶是否處與非活躍狀態，如果用戶長時間沒有在頁面上進行任何操作，我們則判定該用戶是非活躍的。在 javascript 中我們可以通過監聽某些滑鼠或鍵盤相關的事件來判定用戶是否在活躍中。 ...
JavaScript中執行上下文和執行棧是什麼？

一、執行上下文簡單的來說，執行上下文是一種對Javascript代碼執行環境的抽象概念，也就是說只要有Javascript代碼運行，那麼它就一定是運行在執行上下文中執行上下文的類型分為三種：全局執行上下文：只有一個，瀏覽器中的全局對象就是 window對象，this 指向這個全局對象函數執行 ...