將Word轉換為HTML能將文檔內容發佈在網頁上,這樣,用戶就可以通過瀏覽器直接查看或閱讀文檔而無需安裝特定的軟體。Word轉HTML對於線上發佈信息、創建線上文檔庫以及構建互動式網頁應用程式都非常有用。以下是使用Python將Word轉換為HTML網頁的攻略,包含兩個示例。 使用Python 將W ...
將Word轉換為HTML能將文檔內容發佈在網頁上,這樣,用戶就可以通過瀏覽器直接查看或閱讀文檔而無需安裝特定的軟體。Word轉HTML對於線上發佈信息、創建線上文檔庫以及構建互動式網頁應用程式都非常有用。以下是使用Python將Word轉換為HTML網頁的攻略,包含兩個示例。
- 使用Python 將Word Doc/Docx轉為HTML格式
- 使用Python 將Word轉為HTML並嵌入CSS樣式、圖片等
在進行該轉換操作前,需要先安裝Spire.Doc for Python庫。它是一款專業的Python Word 開發組件,可輕鬆實現 Word 文檔的創建、讀取、編輯和轉換等功能。
產品安裝pip 命令:
pip install Spire.Doc
用Python 將Word Doc/Docx轉為HTML格式
第一個示例是一個特別簡單的轉換方法,僅需載入一個 .doc或 .docx文檔,然後使用 Document.SaveToFile(fileName string, FileFormat.Html) 方法就能將Word文檔另存為HTML格式。代碼如下:
from spire.doc import * from spire.doc.common import * # 創建Document對象 document = Document() # 載入一個doc或docx文檔 document.LoadFromFile("財務報告.docx") # 保存為HTML文件 document.SaveToFile("Word轉Html.html", FileFormat.Html) document.Close()
效果圖:
用Python 將Word轉為HTML並嵌入CSS樣式、圖片等
如果在轉換時想要嵌入特定的CSS樣式,如內部樣式 Internal、外部樣式 External,或者需要嵌入圖片等,可以用Spire.Doc for Python 提供的 HtmlExportOptions 類。代碼如下:
from spire.doc import * from spire.doc.common import * # 創建Document對象 document = Document() # 載入Word文檔 document.LoadFromFile("財務報告.docx") # 嵌入CSS樣式 document.HtmlExportOptions.CssStyleSheetFileName = "sample.css" document.HtmlExportOptions.CssStyleSheetType = CssStyleSheetType.External # 設置是否嵌入圖像 document.HtmlExportOptions.ImageEmbedded = False document.HtmlExportOptions.ImagesPath = "Images/" # 設置是否將表單欄位導出為純文本 document.HtmlExportOptions.IsTextInputFormFieldAsText = True # 將文檔保存為 html 文件 document.SaveToFile("轉Html.html", FileFormat.Html) document.Close()
參考文章:
如何在 VS Code中安裝 Spire.Doc for Python
用Python 將Word Doc/Docx轉為HTML格式
用Python 將Word轉為HTML並嵌入CSS樣式、圖片等