NPOI處理Word文本中上下角標_ZenDei技術網路在線

NPOI處理Word文本中上下角標

-Advertisement-

讀取Word文檔，並將文本轉成html標簽，後面發現，經常有帶上下角標的內容，於是一併處理了。核心在於對XWPFRun對象中Subscript屬性的處理。 Word文檔：輸出： 測試上下ok。CO2<p ...

讀取Word文檔，並將文本轉成html標簽，後面發現，經常有帶上下角標的內容，於是一併處理了。

核心在於對XWPFRun對象中Subscript屬性的處理。

 1         /// <summary>
 2         /// 讀取Word,並識別文本中的上下角標
 3         /// </summary>
 4         /// <param name="fileName"></param>
 5         /// <returns></returns>
 6         public static string ReadWordTextExWithSubscript(string fileName)
 7         {
 8 
 9             string fileText = string.Empty;
10             StringBuilder sbFileText = new StringBuilder();
11 
12             #region 打開文檔
13             XWPFDocument document = null;
14             try
15             {
16                 using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))
17                 {
18                     document = new XWPFDocument(file);
19                 }
20             }
21             catch (Exception e)
22             {
23                 throw e;
24             }
25             #endregion
26             //正文段落
27             foreach (XWPFParagraph paragraph in document.Paragraphs)
28             {
29                 //獲取段樓中的句列表
30                 IList<XWPFRun> runsLists = paragraph.Runs;
31 
32                 sbFileText.Append("<p>");
33                 foreach (XWPFRun run in runsLists)
34                 {
35                     switch (run.Subscript)
36                     {
37                         case VerticalAlign.BASELINE:
38                             sbFileText.Append(run.Text);
39                             break;
40                         //上角標
41                         case VerticalAlign.SUPERSCRIPT:
42                             sbFileText.Append("<sup>" + run.Text + "</sup>");
43                             break;
44                         //下角標
45                         case VerticalAlign.SUBSCRIPT:
46                             sbFileText.Append("<sub>" + run.Text + "</sub>");
47                             break;
48                         default:
49                             sbFileText.Append(run.Text);
50                             break;
51                     }
52                     
53                 }
54                 sbFileText.AppendLine("</p>");
55             }
56             fileText = sbFileText.ToString();
57 
58             return fileText;
59         }

Word文檔：

輸出：

測試上下ok。
CO2
面積約6000km2

Html預覽：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

MyBatis簡單入門

1.MyBatis架構（簡單介紹MyBatis的流程）接下來簡單介紹一下這張圖：首先明確我們的目的就是要創建sqlsession然後利用這個對象去執行sql 完成CRUD。創建sqlsession的前提就是用session工廠去創建，利用工廠創建需要原材料啊，所以最頂端的MyBatis配置文件就是 ...
spring-消息

1、非同步消息當一個消息發送時候，消息會被交給消息代理，消息代理可以確保消息被髮送到指定的目的地，同時解放發送者，使其能夠繼續進行其它業務。消息代理通常有ActiveMQ、RabbitMQ...，目的地通常有隊列和主題，隊列採用點對點的模型，主題採用發佈訂閱模型點對點模型：消息隊列可以有多個接受者 ...
27_多線程_第27天（線程安全、線程同步、等待喚醒機制、單例設計模式）_講義

1、多線程安全問題 2、等待喚醒機制 ...
python leetcode 字元串相乘

給定兩個以字元串形式表示的非負整數 num1 和 num2，返回 num1 和 num2 的乘積，它們的乘積也表示為字元串形式。示例 1: 示例 2: 說明：從題目要求來看，應該是讓我們實現一個比較省記憶體的大數乘法，先分享幾個我在discuss中發現的不太切合題意的解法：這個可以說是個毫無技術 ...
Java 註解

一、概念和基本註解從JDK1.5開始，引入了源代碼中的註解這一機制。註解使得 Java 源代碼中不但可以包含功能性的實現代碼，還可以包含元數據。那麼什麼是元數據呢？所謂元數據，就是描述數據的數據。比如說一張圖片，圖片內容是它的主體數據，那麼像圖片的創建時間、修改時間、創建者等等這些數據，就是這張 ...
netcore服務程式暴力退出導致的業務數據不一致的一種解決方案（優雅退出）

一：問題提出現如今大家寫的netcore程式大多部署在linux平臺上，而且服務程式裡面可能會做各種複雜的操作，涉及到多數據源（mysql，redis，kafka）。成功部署成後臺進程之後，你以為這樣就萬事大吉了？卻不知當你更新代碼時，暴力的kill掉這個進程導致你的業務出現數據不一致，業務 ...
asp.net core mvc 管道之中間件

asp.net core mvc 管道之中間件 http請求處理管道通過註冊中間件來實現各種功能，松耦合併且很靈活此文簡單介紹asp.net core mvc中間件的註冊以及運行過程通過理解中間件，將asp.net core mvc分解，以便更好地學習中間件寫法先看一個簡單的中間件，next ...
在.NET Core中三種實現“可插拔”AOP編程方式（附源碼）

一看標題肯定會聯想到使用動態編織的方式實現AOP編程，不過這不是作者本文討論的重點。本文討論另外三種在netcore中可實現的方式，Filter（過濾器，嚴格意義上它算是AOP方式），DynamicProxy（動態代理方式，JAVA上早已不是新鮮事），Middleware（netcore中間件所實 ...