用 python-docx 創建浮動圖片

来源:https://www.cnblogs.com/dancesir/archive/2023/10/26/17788854.html
-Advertisement-
Play Games

相信大家對python-docx這個常用的操作docx文檔的庫都不陌生,它支持以內聯形狀(Inline Shape)的形式插入圖片,即圖片和文本之間沒有重疊,遵循流動版式(flow layout)。但是,截至最新的0.8.10版本,python-docx尚不支持插入浮動圖片(floating pic ...


相信大家對python-docx這個常用的操作docx文檔的庫都不陌生,它支持以內聯形狀(Inline Shape)的形式插入圖片,即圖片和文本之間沒有重疊,遵循流動版式(flow layout)。但是,截至最新的0.8.10版本,python-docx尚不支持插入浮動圖片(floating picture)。這顯然不能滿足豐富多彩的文檔樣式的需要,因此本文探究基於python-docx插入浮動圖片——剖析xml、追蹤源碼,最後得到完整代碼。

問題提出

作者在嘗試實現PDF文檔轉docx(pdf2docx:https://github.com/dothinking/pdf2docx,開發中)的過程中遇到一個需求:根據背景圖片在PDF頁面的具體位置(例如左上角坐標和圖片區域的長寬),將其重現到docx頁面的相應位置。考慮到背景圖片與文本的重疊,這就需要實現精確定位的浮動圖片,參考下圖示例。

 

Word中的設置

我們先嘗試在Office Word中,手動解決上述問題。具備基礎的Word使用經驗即可知,通過設置圖片版式來控製圖片的浮動和具體位置。

 

上圖版式設置中的文本環繞樣式,大體可以分為三類:

分類文本重疊自由定位樣式名稱
嵌入型 In line with text
環繞型 Square, Tight, Through, Top and bottom
完全浮動 behind text, In front of text

例如最常見的嵌入型圖片,它占據了整行區域,我們既不能將其與文字重疊,也不能自由放置它的位置,而是由頁面排版自動確定。對於環繞型圖片,文本可以進入圖片所在行,但是無法與之重疊;並且,我們可以用滑鼠自由拖動其位置。完全浮動型圖片則可以浮於文本上方或者襯於文本下方,同時支持隨意放置其位置。

如果需要精確定位,則可在圖片版式的位置(Position)選項卡進行設置。它提供了多種定位方式,例如絕對定位——根據圖片左上角點距離水平和豎直參考的坐標值來定位。至於參考對象,可以是頁面(Page)本身,這樣(0, 0)就是頁面左上角;也可以是邊距(Margin),此時(0, 0)即為正文區域的左上角。

綜上,我們需要實現精確定位襯於文本下方的圖片版式。

docx背後的xml

我們還知道,docx文檔的背後是xml格式的數據,python-docx正是通過處理xml的方式來讀寫word文檔。所以,接下來先手工創建word文檔,然後查看圖片部分的xml內容。

作為對比,首先分別創建一個普通嵌入型圖片文件和一個襯於文本下方的浮動型圖片文件。然後執行查看步驟:右鍵docx文件 | 7-zip打開壓縮包 | word | document.xml,複製文件內容並格式化xml,得到如下的關於圖片部分的片段。為了便於對比分析,刪除了一些節點屬性。

內聯圖片片段:

<w:drawing>
    <wp:inline>
        <wp:extent cx="3297600" cy="2782800"/>
        <wp:effectExtent l="0" t="0" r="0" b="0"/>
        <wp:docPr id="1" name="Picture 1"/>
        <wp:cNvGraphicFramePr>
            <a:graphicFrameLocks/>
        </wp:cNvGraphicFramePr>
        <a:graphic>
            <a:graphicData>
                <pic:pic>
                    <!-- more pic content -->
                </pic:pic>
            </a:graphicData>
        </a:graphic>
    </wp:inline>
</w:drawing>

浮動圖片片段:

<w:drawing>
    <wp:anchor behindDoc="1" locked="0" layoutInCell="1" allowOverlap="1">
        <wp:simplePos x="0" y="0"/>
        <wp:positionH relativeFrom="page">
            <wp:posOffset>285750</wp:posOffset>
        </wp:positionH>
        <wp:positionV relativeFrom="page">
            <wp:posOffset>457200</wp:posOffset>
        </wp:positionV>
        <wp:extent cx="3297600" cy="2782800"/>
        <wp:effectExtent l="0" t="0" r="0" b="0"/>
        <wp:wrapNone/>
        <wp:docPr id="1" name="Picture 1"/>
        <wp:cNvGraphicFramePr>
            <a:graphicFrameLocks/>
        </wp:cNvGraphicFramePr>
        <a:graphic>
            <a:graphicData>
                <pic:pic>
                    <!-- more pic content -->
                </pic:pic>
            </a:graphicData>
        </a:graphic>
    </wp:anchor>
</w:drawing>

對比發現以下相同/相似點:

  • 兩類圖片都放在<w:drawing>節點下:內聯圖片<wp:inline>,浮動圖片<wp:anchor>
  • 具備相同的內容節點:<wp:extent><wp:docPr><a:graphic>

除此之外,浮動圖片還有一些獨有特征,並且我們可以從命名上猜測和解讀:

  • <wp:anchor>節點的behindDoc屬性表明圖片版式為襯於文本下方
  • <wp:positionH><wp:positionV>節點表明水平和豎直絕對定位方式,其中:
    • relativeFrom屬性指定用於定位的參考對象
    • 子節點<wp:posOffset>指定具體坐標值

從內聯圖片開始

從xml的結構對比來看,我們完全可以根據python-docx對內聯圖片的實現來插入浮動圖片。於是,從插入內聯圖片的代碼入手:

from docx import Document
from docx.shared import Pt

document = Document()
document.add_picture('image.jpg', width=Pt(200))
document.save('output.docx')

python-docx安裝文件夾site-packages/docx進行內容搜索add_picture,得到docx.text.run.add_picture原始定義處:

def add_picture(self, image_path_or_stream, width=None, height=None):
    inline = self.part.new_pic_inline(image_path_or_stream, width, height)
    self._r.add_drawing(inline)
    return InlineShape(inline)

繼續搜索new_pic_inline得到docx.parts.story.BaseStoryPart.new_pic_inline。從註釋可知這是利用CT_Inline類創建<wp:inline>元素,因此後續創建浮動圖片的<wp:anchor>可以在此基礎上修改。

def new_pic_inline(self, image_descriptor, width, height):
    """Return a newly-created `w:inline` element.

    The element contains the image specified by *image_descriptor* and is scaled
    based on the values of *width* and *height*.
    """
    rId, image = self.get_or_add_image(image_descriptor)
    cx, cy = image.scaled_dimensions(width, height)
    shape_id, filename = self.next_id, image.filename
    return CT_Inline.new_pic_inline(shape_id, rId, filename, cx, cy)

於是進入CT_Inline類(限於篇幅,刪除了前兩個類方法newnew_pic_inline的具體代碼)——終於見到了一開始探索的xml代碼:

class CT_Inline(BaseOxmlElement):
    """
    ``<w:inline>`` element, container for an inline shape.
    """
    @classmethod
    def new(cls, cx, cy, shape_id, pic):
        pass

    @classmethod
    def new_pic_inline(cls, shape_id, rId, filename, cx, cy):
        pass

    @classmethod
    def _inline_xml(cls):
        return (
            '<wp:inline %s>\n'
            '  <wp:extent cx="914400" cy="914400"/>\n'
            '  <wp:docPr id="666" name="unnamed"/>\n'
            '  <wp:cNvGraphicFramePr>\n'
            '    <a:graphicFrameLocks noChangeAspect="1"/>\n'
            '  </wp:cNvGraphicFramePr>\n'
            '  <a:graphic>\n'
            '    <a:graphicData uri="URI not set"/>\n'
            '  </a:graphic>\n'
            '</wp:inline>' % nsdecls('wp', 'a', 'pic', 'r')
        )

簡單掃一下CT_Inline類的三個方法,即可將它們聯繫上:

  • _inline_xml()方法給出內聯圖片<wp:inline>的xml結構。
  • new()方法調用_inline_xml(),併為其中的子節點例如<wp:extent><wp:docPr>賦值。
  • new_pic_inline()調用new(),同時拼接CT_Picture類的結果(節點<pic:pic>,即圖片的具體內容)到<a:graphicData>節點中去。

綜上,實現了內聯圖片的完整xml結構。

插入浮動圖片

從xml結構的對比及上述python-docx對內聯圖片的實現,得到創建浮動圖片的思路:

  • 初始化<wp:anchor>結構,例如behindDoc="1"指定圖片版式為襯於文本下方
  • 使用類似的代碼填充<wp:anchor>元素,尤其是<wp:extent><wp:docPr><pic:pic>
  • 填充<wp:positionH><wp:positionV>精確定點陣圖片

具體實踐中發現還有關鍵的一步——註冊xml標簽名稱到對應的類,例如<wp:inline>CT_Inline

# docx.oxml.__init__.py
register_element_cls('wp:inline', CT_Inline)

綜上,利用python-docx插入浮動圖片(襯於文本下方、頁面定位)的完整代碼如下:

# -*- coding: utf-8 -*-

# filename: add_float_picture.py

'''
Implement floating image based on python-docx.

- Text wrapping style: BEHIND TEXT <wp:anchor behindDoc="1">
- Picture position: top-left corner of PAGE `<wp:positionH relativeFrom="page">`.

Create a docx sample (Layout | Positions | More Layout Options) and explore the 
source xml (Open as a zip | word | document.xml) to implement other text wrapping
styles and position modes per `CT_Anchor._anchor_xml()`.
'''

from docx.oxml import parse_xml, register_element_cls
from docx.oxml.ns import nsdecls
from docx.oxml.shape import CT_Picture
from docx.oxml.xmlchemy import BaseOxmlElement, OneAndOnlyOne

# refer to docx.oxml.shape.CT_Inline
class CT_Anchor(BaseOxmlElement):
    """
    ``<w:anchor>`` element, container for a floating image.
    """
    extent = OneAndOnlyOne('wp:extent')
    docPr = OneAndOnlyOne('wp:docPr')
    graphic = OneAndOnlyOne('a:graphic')

    @classmethod
    def new(cls, cx, cy, shape_id, pic, pos_x, pos_y):
        """
        Return a new ``<wp:anchor>`` element populated with the values passed
        as parameters.
        """
        anchor = parse_xml(cls._anchor_xml(pos_x, pos_y))
        anchor.extent.cx = cx
        anchor.extent.cy = cy
        anchor.docPr.id = shape_id
        anchor.docPr.name = 'Picture %d' % shape_id
        anchor.graphic.graphicData.uri = (
            'http://schemas.openxmlformats.org/drawingml/2006/picture'
        )
        anchor.graphic.graphicData._insert_pic(pic)
        return anchor

    @classmethod
    def new_pic_anchor(cls, shape_id, rId, filename, cx, cy, pos_x, pos_y):
        """
        Return a new `wp:anchor` element containing the `pic:pic` element
        specified by the argument values.
        """
        pic_id = 0  # Word doesn't seem to use this, but does not omit it
        pic = CT_Picture.new(pic_id, filename, rId, cx, cy)
        anchor = cls.new(cx, cy, shape_id, pic, pos_x, pos_y)
        anchor.graphic.graphicData._insert_pic(pic)
        return anchor

    @classmethod
    def _anchor_xml(cls, pos_x, pos_y):
        return (
            '<wp:anchor distT="0" distB="0" distL="0" distR="0" simplePos="0" relativeHeight="0" \n'
            '           behindDoc="1" locked="0" layoutInCell="1" allowOverlap="1" \n'
            '           %s>\n'
            '  <wp:simplePos x="0" y="0"/>\n'
            '  <wp:positionH relativeFrom="page">\n'
            '    <wp:posOffset>%d</wp:posOffset>\n'
            '  </wp:positionH>\n'
            '  <wp:positionV relativeFrom="page">\n'
            '    <wp:posOffset>%d</wp:posOffset>\n'
            '  </wp:positionV>\n'                    
            '  <wp:extent cx="914400" cy="914400"/>\n'
            '  <wp:wrapNone/>\n'
            '  <wp:docPr id="666" name="unnamed"/>\n'
            '  <wp:cNvGraphicFramePr>\n'
            '    <a:graphicFrameLocks noChangeAspect="1"/>\n'
            '  </wp:cNvGraphicFramePr>\n'
            '  <a:graphic>\n'
            '    <a:graphicData uri="URI not set"/>\n'
            '  </a:graphic>\n'
            '</wp:anchor>' % ( nsdecls('wp', 'a', 'pic', 'r'), int(pos_x), int(pos_y) )
        )


# refer to docx.parts.story.BaseStoryPart.new_pic_inline
def new_pic_anchor(part, image_descriptor, width, height, pos_x, pos_y):
    """Return a newly-created `w:anchor` element.

    The element contains the image specified by *image_descriptor* and is scaled
    based on the values of *width* and *height*.
    """
    rId, image = part.get_or_add_image(image_descriptor)
    cx, cy = image.scaled_dimensions(width, height)
    shape_id, filename = part.next_id, image.filename    
    return CT_Anchor.new_pic_anchor(shape_id, rId, filename, cx, cy, pos_x, pos_y)


# refer to docx.text.run.add_picture
def add_float_picture(p, image_path_or_stream, width=None, height=None, pos_x=0, pos_y=0):
    """Add float picture at fixed position `pos_x` and `pos_y` to the top-left point of page.
    """
    run = p.add_run()
    anchor = new_pic_anchor(run.part, image_path_or_stream, width, height, pos_x, pos_y)
    run._r.add_drawing(anchor)

# refer to docx.oxml.__init__.py
register_element_cls('wp:anchor', CT_Anchor)

示例

最後,來一個例子看看結果吧:

from docx import Document
from docx.shared import Inches, Pt
from add_float_picture import add_float_picture

if __name__ == '__main__':

    document = Document()

    # add a floating picture
    p = document.add_paragraph()
    add_float_picture(p, 'test.png', width=Inches(5.0), pos_x=Pt(20), pos_y=Pt(30))

    # add text
    p.add_run('Hello World '*50)

    document.save('output.docx')

 

作者:crazyhat,Python及科學計算愛好者


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這是典型的程式業務處理的方式。——接收到請求入參後,先進行前置校驗,如果校驗失敗直接中止返回,否則才走後續的業務處理流程。 ...
  • 繼承允許我們定義一個類,該類繼承另一個類的所有方法和屬性。父類是被繼承的類,也叫做基類。子類是從另一個類繼承的類,也叫做派生類。 創建一個父類 任何類都可以成為父類,因此語法與創建任何其他類相同: 示例,創建一個名為 Person 的類,具有 firstname 和 lastname 屬性以及一個 ...
  • 本文主要針對的自己寫的包無法正常import的情況,如果是第三方包的話正常來說沒有問題。 第三方包 主要考慮沒有安裝對應的版本以及包名寫錯了等奇葩情況,具體可參考ModuleNotFoundError: No module named ‘xxx’可能的解決方案大全 自建的包 如果是自己的包,可按照下 ...
  • 9.1、環境搭建 9.1.1、在project創建新module 9.1.2、選擇maven 9.1.3、設置module名稱和路徑 9.1.4、module初始狀態 9.1.5、配置打包方式和引入依賴 註意:預設的打包方式為 jar,為了能配置web資源,需要將打包方式設置為 war <?xml ...
  • 1. maven打包方式 maven打包有三種方式 pom、jar、war。在pom.xml 文件中聲明的方式分別如下: <!-- 1. pom方式 --> <packaging>pom</packaging>` <!-- 2. jar方式 --> <packaging>jar</packaging ...
  • 不,代碼是值錢的! 前幾天我們一直服務的一個客戶覺得自己用了兩三年的UI太醜,乞求我們換一套。集團領導討論後一口報價30w,牛逼哄哄說:很麻煩的啊,要先設計UI庫,然後把所有頁面都換個樣,又要測試這玩意(內行人都明白前端能測出啥bug,也就可能要考慮優化),大概要6個人做一個月。 然後我這架構大頭兵 ...
  • 說明 介紹 該腳本使用Selenium庫來實現自動登錄併在指定的時間購買商品。 運行前準備 mac 的safari瀏覽器本身已經集成了safaridriver,只要啟用並開啟即可,步驟如下: 終端啟用safaridriver: sudo safaridriver --enable 嘗試運行safra ...
  • 在查找二叉樹某個節點時,如果把二叉樹所有節點理理解為解空間,待找到那個節點理解為滿足特定條件的解,對此解答可以抽象描述為: _在解空間中搜索滿足特定條件的解_,這其實就是搜索演算法(Search)的一種描述。當然也有其他描述,比如是“指一類用於在數據集合中查找特定項或解決問題的演算法”,又或者是“指通過... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...