PDF是當今最流行的文檔格式之一,各種應用程式將其用作最終輸出。由於支持多種數據類型和可移植性,因此它是創建和共用內容的首選格式。作為對開發文檔管理應用程式感興趣的.NET應用程式開發人員,可能希望嵌入處理功能,以讀取PDF文檔並將其轉換為其他文件格式,例如HTML。 下麵,來探索並演示一下Aspo ...
PDF是當今最流行的文檔格式之一,各種應用程式將其用作最終輸出。由於支持多種數據類型和可移植性,因此它是創建和共用內容的首選格式。作為對開發文檔管理應用程式感興趣的.NET應用程式開發人員,可能希望嵌入處理功能,以讀取PDF文檔並將其轉換為其他文件格式,例如HTML。
下麵,來探索並演示一下Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件並將其轉換為HTML。
將HTML轉換到PDF
只需使用幾行代碼和資源載入回調就可以以非常基本的方式將HTML轉換為PDF,以下是使您達到目的的代碼段:
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); HtmlLoadOptions options = new HtmlLoadOptions(); options.CustomLoaderOfExternalResources = new LoadOptions.ResourceLoadingStrategy(SamePictureLoader); Document pdfDocument = new Document(dataDir + "HTMLToPDF.html", options); pdfDocument.Save("HTMLToPDF_out.pdf");
將PDF轉換為多頁HTML
可以使用以下示例代碼在將PDF轉換為HTML的過程中,將上述步驟中的HTML分為多個頁面。
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); // Open the source PDF document Document pdfDocument = new Document(dataDir + "PDFToHTML.pdf"); // Instantiate HTML SaveOptions object HtmlSaveOptions htmlOptions = new HtmlSaveOptions(); // Specify to split the output into multiple pages htmlOptions.SplitIntoPages = true; // Save the document pdfDocument.Save(@"MultiPageHTML_out.html", htmlOptions);
將SplitIntoPages標誌設置為true可以為您完成所有工作,並且輸出HTML由多個頁面而不是單個頁面組成。
將圖像保存到特定文件夾
PDF文檔除了文本詳細信息外還可以包含圖像。HTML可以包含HTML內基於64位編碼的圖像,也可以引用這些圖像所在的文件夾中的圖像。Aspose.PDF API具有豐富的功能,可以將圖像保存到光碟上用戶指定的文件夾中。以下代碼示例顯示了在將PDF轉換為HTML的過程中如何將圖像保存到特定文件夾。
// Create HtmlSaveOption with tested feature HtmlSaveOptions newOptions = new HtmlSaveOptions(); // Specify the separate folder to save images newOptions.SpecialFolderForAllImages = dataDir;