使用Aspose.PDF for .NET將PDF轉換為HTML格式示例解讀(6)——在style.css中設置字體的URL首碼

来源:https://www.cnblogs.com/mnrssj-Aspsoe/archive/2019/11/11/11834648.html
-Advertisement-
Play Games

PDF是當今最流行的文檔格式之一,各種應用程式將其用作最終輸出。由於支持多種數據類型和可移植性,因此它是創建和共用內容的首選格式。作為對開發文檔管理應用程式感興趣的.NET應用程式開發人員,可能希望嵌入處理功能,以讀取PDF文檔並將其轉換為其他文件格式,例如HTML。 Aspose.PDF for ...


PDF是當今最流行的文檔格式之一,各種應用程式將其用作最終輸出。由於支持多種數據類型和可移植性,因此它是創建和共用內容的首選格式。作為對開發文檔管理應用程式感興趣的.NET應用程式開發人員,可能希望嵌入處理功能,以讀取PDF文檔並將其轉換為其他文件格式,例如HTML。

Aspose.PDF for .NET是一種高級PDF處理和解析API,用於在跨平臺應用程式中執行文檔管理和操作任務。API可以輕鬆用於生成,修改,轉換,渲染,保護和列印PDF文檔,而無需使用Adobe Acrobat。

在本文中,我們將探索並演示Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件並將其轉換為HTML。


PDF轉HTML-在style.css中設置字體的URL首碼

Aspose.PDF for .NET提供了將HTML文件轉換為PDF並將PDF文件轉換為HTML的功能。在PDF到HTML的轉換過程中,PDF中使用的TrueType字體保存在文件系統中。

在高版本中,可以使用自定義資源節省策略為字體設置自定義URL:

 

//文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();

Document doc = new Document(dataDir + "input.pdf");
string outHtmlFile = dataDir + "PrefixForFonts_out.html";
_desiredFontDir = Path.GetDirectoryName(outHtmlFile) + @"\36296_files\";
if (!Directory.Exists(_desiredFontDir))
{
    Directory.CreateDirectory(_desiredFontDir);
}
// 重置字體名稱計數器-此計數器將在我們的自定義代碼中使用
// 生成唯一字體文件名

_fontNumberForUniqueFontFileNames = 0;

// 使用自定義保存策略創建HtmlSaveOption,它將完成所有工作
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CustomResourceSavingStrategy = new HtmlSaveOptions.ResourceSavingStrategy(CustomResourcesProcessing);
doc.Save(outHtmlFile, saveOptions);

客戶處理實例

private static string CustomResourcesProcessing(SaveOptions.ResourceSavingInfo resourceSavingInfo)
{
    //-----------------------------------------------------------------------------
    // 這隻是可能實現資源的客戶處理的示例
    //在結果HTML中引用
    //-----------------------------------------------------------------------------

    // 1)在這種情況下,我們只需要做一些特別的事情
    //     使用字體,因此讓我們保留所有其他資源的處理
    //     轉換本身
    if (resourceSavingInfo.ResourceType != SaveOptions.NodeLevelResourceType.Font)
    {
        resourceSavingInfo.CustomProcessingCancelled = true;
        return "";
    }

    // 如果提供了字體資源,請自行處理
    // 1)將提供的帶有短名稱的字體寫入所需的文件夾
    //    您可以輕鬆地做任何事情-這隻是實現之一

    _fontNumberForUniqueFontFileNames++;
    string shortFontFileName = (_fontNumberForUniqueFontFileNames.ToString() + Path.GetExtension(resourceSavingInfo.SupposedFileName));
    string outFontPath = _desiredFontDir + "\\" + shortFontFileName;

    System.IO.BinaryReader fontBinaryReader = new BinaryReader(resourceSavingInfo.ContentStream);
    System.IO.File.WriteAllBytes(outFontPath, fontBinaryReader.ReadBytes((int)resourceSavingInfo.ContentStream.Length));


    // 返回所需的URI,CSS中將使用該URI引用字體
    string fontUrl = "http:// Localhost:255/document-viewer/GetFont/" + shortFontFileName;
    return fontUrl;
}

如果您有任何下載或其他需求,請隨時加入Aspose技術交流群(642018183)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在MVC4中直接可以使用await和async,而MVC3中需要繼承AsyncController,才可以使用。 ...
  • Topshelf+Quatz.Net的簡單使用 一 Topshelf概述 Topshelf是創建Windows服務的另一種方法,老外的一篇文章Create a .NET Windows Service in 5 steps with Topshelf通過5個步驟詳細的介紹使用使用Topshelf創建 ...
  • 今天將一個測試的網站發佈到阿裡雲虛擬主機後,訪問網站報“組策略阻止了這個程式。要獲取詳細信息,請與系統管理員聯繫。”錯誤。如下: 經過調查,原來罪魁禍首是 Microsoft.CodeDom.Providers.DotNetCompilerPlatform 這個程式包。 解決辦法: 打開NuGet包 ...
  • 簡介 什麼是 Google Protocol Buffer? 假如您在網上搜索,應該會得到類似這樣的文字介紹: Google Protocol Buffer( 簡稱 Protobuf) 是 Google 公司內部的混合語言數據標準,目前已經正在使用的有超過 48,162 種報文格式定義和超過 12, ...
  • using System; namespace test { class Program { static void Main(string[] args) { Cat kitty = new Cat(); // 無參構造函數 Cat1 KITTY = new Cat1("KITTY", 4); C ...
  • IIS文件上傳大小限制30M,C盤中有的IIS_schema.xml文件 C:\Windows\System32\inetsrv\config\schema\ 但是考慮到安全等問題,而且這個文件預設是只讀的,所以不建議直接修改這個配置文件,而應該在iis的管理器里修改: 一、打開某一個網站或者點擊根 ...
  • 基本數據類型 C 支持完整的BCL(基類庫)名字,但是最好都統一使用關鍵字進行使用與開發,比如使用int而不是System.Int32,以及使用string類型時候應當使用string而不是Systen.String以及String。 作為一名擁有良好編寫習慣的程式員,要一致!不要變來變去! 整數類 ...
  • 前言:作為一個程式員你要學會調試,對於一種調試都無法找到問題所在的情況,你要學會看日誌,要學會看日誌你的學會怎麼樣去寫入日誌,接下來教你配置C#Log4 第一步,你的在配置文件中配置好對應的參數 <!--配置log4--> <configSections> <section name="log4ne ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...