NPOI處理Word文本中上下角標

来源:https://www.cnblogs.com/sasayaki/archive/2018/09/02/9574886.html
-Advertisement-
Play Games

讀取Word文檔,並將文本轉成html標簽,後面發現,經常有帶上下角標的內容,於是一併處理了。 核心在於對XWPFRun對象中Subscript屬性的處理。 Word文檔: 輸出: <p>測試<sup>上</sup><sub>下</sub>ok。</p><p>CO<sub>2</sub></p><p ...


讀取Word文檔,並將文本轉成html標簽,後面發現,經常有帶上下角標的內容,於是一併處理了。

核心在於對XWPFRun對象中Subscript屬性的處理。

 1         /// <summary>
 2         /// 讀取Word,並識別文本中的上下角標
 3         /// </summary>
 4         /// <param name="fileName"></param>
 5         /// <returns></returns>
 6         public static string ReadWordTextExWithSubscript(string fileName)
 7         {
 8 
 9             string fileText = string.Empty;
10             StringBuilder sbFileText = new StringBuilder();
11 
12             #region 打開文檔
13             XWPFDocument document = null;
14             try
15             {
16                 using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))
17                 {
18                     document = new XWPFDocument(file);
19                 }
20             }
21             catch (Exception e)
22             {
23                 throw e;
24             }
25             #endregion
26             //正文段落
27             foreach (XWPFParagraph paragraph in document.Paragraphs)
28             {
29                 //獲取段樓中的句列表
30                 IList<XWPFRun> runsLists = paragraph.Runs;
31 
32                 sbFileText.Append("<p>");
33                 foreach (XWPFRun run in runsLists)
34                 {
35                     switch (run.Subscript)
36                     {
37                         case VerticalAlign.BASELINE:
38                             sbFileText.Append(run.Text);
39                             break;
40                         //上角標
41                         case VerticalAlign.SUPERSCRIPT:
42                             sbFileText.Append("<sup>" + run.Text + "</sup>");
43                             break;
44                         //下角標
45                         case VerticalAlign.SUBSCRIPT:
46                             sbFileText.Append("<sub>" + run.Text + "</sub>");
47                             break;
48                         default:
49                             sbFileText.Append(run.Text);
50                             break;
51                     }
52                     
53                 }
54                 sbFileText.AppendLine("</p>");
55             }
56             fileText = sbFileText.ToString();
57 
58             return fileText;
59         }

Word文檔:

輸出:

<p>測試<sup>上</sup><sub>下</sub>ok。</p>
<p>CO<sub>2</sub></p>
<p>面積約6000km<sup>2</sup></p>

Html預覽:

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.MyBatis架構(簡單介紹MyBatis的流程) 接下來簡單介紹一下這張圖:首先明確我們的目的就是要創建sqlsession然後利用這個對象去執行sql 完成CRUD。創建sqlsession的前提就是用session工廠去創建,利用工廠創建需要原材料啊,所以最頂端的MyBatis配置文件就是 ...
  • 1、非同步消息 當一個消息發送時候,消息會被交給消息代理,消息代理可以確保消息被髮送到指定的目的地,同時解放發送者,使其能夠繼續進行其它業務。消息代理通常有ActiveMQ、RabbitMQ...,目的地通常有隊列和主題,隊列採用點對點的模型,主題採用發佈訂閱模型 點對點模型:消息隊列可以有多個接受者 ...
  • 1、多線程安全問題 2、等待喚醒機制 ...
  • 給定兩個以字元串形式表示的非負整數 num1 和 num2,返回 num1 和 num2 的乘積,它們的乘積也表示為字元串形式。 示例 1: 示例 2: 說明: 從題目要求來看,應該是讓我們實現一個比較省記憶體的大數乘法,先分享幾個我在discuss中發現的不太切合題意的解法: 這個可以說是個毫無技術 ...
  • 一、概念和基本註解 從JDK1.5開始,引入了源代碼中的註解這一機制。註解使得 Java 源代碼中不但可以包含功能性的實現代碼,還可以包含元數據。 那麼什麼是元數據呢?所謂元數據,就是描述數據的數據。比如說一張圖片,圖片內容是它的主體數據,那麼像圖片的創建時間、修改時間、創建者等等這些數據,就是這張 ...
  • 一: 問題提出 現如今大家寫的netcore程式大多部署在linux平臺上,而且服務程式裡面可能會做各種複雜的操作,涉及到多數據源(mysql,redis,kafka)。成功部署成後臺 進程之後,你以為這樣就萬事大吉了? 卻不知當你更新代碼時,暴力的kill掉這個進程導致你的業務出現數據不一致,業務 ...
  • asp.net core mvc 管道之中間件 http請求處理管道通過註冊中間件來實現各種功能,松耦合併且很靈活 此文簡單介紹asp.net core mvc中間件的註冊以及運行過程 通過理解中間件,將asp.net core mvc分解,以便更好地學習 中間件寫法 先看一個簡單的中間件,next ...
  • 一看標題肯定會聯想到使用動態編織的方式實現AOP編程,不過這不是作者本文討論的重點。 本文討論另外三種在netcore中可實現的方式,Filter(過濾器,嚴格意義上它算是AOP方式),DynamicProxy(動態代理方式,JAVA上早已不是新鮮事),Middleware(netcore中間件所實 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...