多個word轉化成PDF文件後再合併成一個PDF文件

来源:https://www.cnblogs.com/HeroZhang/archive/2023/09/05/17679404.html
-Advertisement-
Play Games

 **多個word 文檔 轉化成 PDF 文件, 最後合併成一個PDF文件** ``` import os from win32com import client from PyPDF2 import PdfMerger # 使用PdfMerger def wordToPdf(folder): # ...


多個word 文檔 轉化成 PDF 文件, 最後合併成一個PDF文件

import os
from win32com import client
from PyPDF2 import PdfMerger  # 使用PdfMerger


def wordToPdf(folder):  # 將 多個word 文檔 轉化成 PDF 文件
    os.chdir(folder)
    file_type = 'docx'
    out_folder = folder + "\\PDF"
    if not os.path.exists(out_folder):
        print('Creating output folder...')
        os.makedirs(out_folder)
        print(out_folder, 'created.')
    else:
        print(out_folder, 'already exists.\n')
    # print(os.listdir("."))
    # exit()
    try:
        for files in os.listdir("."):
            if files.endswith(".docx"):
                out_name = files.replace(file_type, r"pdf")
                in_file = os.path.abspath(folder + "\\" + files)
                out_file = os.path.abspath(out_folder + "\\" + out_name)
                print(in_file, 'Exporting', out_file, "\n\n")
                word = client.DispatchEx("Word.Application")
                word.Visible = 0  # 後臺運行
                word.DisplayAlerts = 0  # 不顯示,不警告
                doc = word.Documents.Open(in_file, Encoding='gbk')
                doc.SaveAs(out_file, FileFormat=17)
                doc.Close()
                word.Quit()
except Exception as e:
        print("出錯了!", e)


def mergePDF(folder):  # 將多個 PDF 文件,合併成一個PDF文件
    # 設置文件所在位置
    target_path = folder + "\\PDF"  # pdf文件所在文件夾絕對路徑
    pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
    pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

    os.chdir(target_path)
    out_folder = target_path + "\\MPDF"
    if not os.path.exists(out_folder):
        print('Creating output folder...')
        os.makedirs(out_folder)
        print(out_folder, 'created.')
    else:
        print(out_folder, 'already exists.\n')
    
    # 調用合併方法
    file_merger = PdfMerger()  # 調用
    for pdf in pdf_lst:
        file_merger.append(pdf)  # 合併pdf文件
    # 選擇合併後文件存儲位置
    out_name = "MergePDF.pdf"
    out_file = os.path.abspath(out_folder + "\\" + out_name)
    file_merger.write(out_file)  # 合併後文件所在位置
    print("合併完成")

if __name__ == '__main__':
    folder = r"J:\1_7"
    wordToPdf(folder)
    mergePDF(folder)

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • # Hook Method 鉤子方法(Hook Method)之所以被稱為“鉤子”,是因為它在演算法或流程中提供了一個“鉤子”,允許子類在特定的點上“鉤入”自己的實現邏輯,從而影響演算法的行為或流程的執行。 它類似於一個掛鉤、錨點,所以叫Hook method, 它允許子類插入自定義的代碼來改變或擴展算 ...
  • 原文在[這裡](https://go.dev/blog/rebuild)。 > 由 Russ Cox 發佈於 2023年8月28日 開源軟體的一個關鍵優勢是任何人都可以閱讀源代碼並檢查其功能。然而,大多數軟體,甚至是開源軟體,都以編譯後的二進位形式下載,這種形式更難以檢查。如果攻擊者想對開源項目進行 ...
  • 類型介面 Go不是面向對象的語言,在go里通過不同的結構體實現同一組公共介面這種組合的形式實現多態,類似C++的類和虛函數 定義類型介面(Interface Definition): 使用 type 關鍵字定義介面,指定介面的方法簽名。 方法簽名由方法的名稱、參數列表和返回值組成,但不包含方法體。 ...
  • ## 教程簡介 Spring框架是一個開放源代碼的J2EE應用程式框架,由Rod Johnson發起,是針對bean的生命周期進行管理的輕量級容器(lightweight container)。 Spring解決了開發者在J2EE開發中遇到的許多常見的問題,提供了功能強大IOC、AOP及Web MV ...
  • # Python文件的基礎操作(2) - 二進位模式下讀寫操作 - 練習 - 控制文件內指針(游標)的移動 - 文件的修改 - 函數的介紹 ## 練習 ```python # 小練習: 編寫拷貝工具 1. 讓用戶輸入被拷貝的文件路徑(源文件路徑) 2. 輸入即將要拷貝的文件路徑(目標文件路徑) 3. ...
  • `@Autowired` 是 Spring Framework 中用於自動註入依賴的註解,通常情況下可以正常工作,但有一些情況下可能無法獲取到 bean 對象: 1. **Bean未定義或未掃描到**:如果要註入的 bean 沒有在 Spring 上下文中定義或者沒有被正確掃描到,`@Autowir ...
  • PEP703是未來去除GIL的計劃,當然現在提案還在繼續修改,但大致方向確定了。 對於實現細節我沒啥興趣多說,挑幾個我比較在意的點講講。 ## 儘量少依賴原子操作的引用計數 沒了GIL之後會出現兩個以上的線程同時操作同一個Python對象的情況,首先要解決的是引用計數的計算不能出岔子,否則整個記憶體管 ...
  • 享元模式在主流的標準里是放到結構大類下的,但是我感覺這個模式的最終作用也是為了獲取一個類,所以我將其劃分到創建大類下。 # What is Flyweight Pattern Flyweight 是指輕量級的。 享元模式旨在支持大量細粒度的對象共用,以減少記憶體消耗。該模式通過共用相似對象的部分狀態, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...