Python基礎系列講解-自動控制windows桌面

来源:https://www.cnblogs.com/zx-coder/archive/2019/12/06/11993017.html
-Advertisement-
Play Games

原鏈接:https://zhuanlan.zhihu.com/p/73001806 在使用PC時與PC交互的主要途徑是看屏幕顯示、聽聲音,點擊滑鼠和敲鍵盤等等。在自動化辦公的趨勢下,繁瑣的工作可以讓程式自動完成。比如自動化測試、自動下單交易等。很多軟體除了可以GUI方式操作外還可以用CLI介面操作, ...


原鏈接:https://zhuanlan.zhihu.com/p/73001806

在使用PC時與PC交互的主要途徑是看屏幕顯示、聽聲音,點擊滑鼠和敲鍵盤等等。在自動化辦公的趨勢下,繁瑣的工作可以讓程式自動完成。比如自動化測試、自動下單交易等。很多軟體除了可以GUI方式操作外還可以用CLI介面操作,不過當一些軟體未提供CLI介面時,我們應該怎麼辦呢?我們還可以用程式控制桌面上的視窗、模擬點擊滑鼠或按下鍵盤等動作來釋放自己。

pywin32是一個Python庫,它為Python提供訪問Windows API的擴展,提供了齊全的windows常量、介面、線程以及COM機制等等,安裝後會自帶一個pythonwin的IDE。接下來主要介紹下如何通過Python去操作windows桌面軟體。

1、打開軟體或文件 ,比如打開一個谷歌瀏覽器,或者打開一個word文件,如下所示:

win32api.ShellExecute(1, 'open',
 r'C:Program Files (x86)GoogleChromeApplicationchrome.exe',
 '', '', 1)
win32api.ShellExecute(1, 'open',
 r'C:UsersJayDesktopEnvironment Guider.docx',
 '', '', 1)

win32api.ShellExecute()的參數主要包括:

HWND:指定父視窗句柄

Operation:指定動作, 譬如"edit",“explore”,“open”,“find”,“print”,“NULL”

FileName:指定要打開的文件或程式

Parameters:指定打開程式所需參數

Directory:預設目錄

ShowCmd:打開選項,可選值:

  • •SW_HIDE = 0; {隱藏視窗,活動狀態給令一個視窗}
  • •SW_SHOWNORMAL = 1; {用最近的大小和位置顯示視窗, 同時令其進入活動狀態}
  • •SW_NORMAL = 1; {用當前的大小和位置顯示一個視窗,不改變活動視窗}
  • •SW_SHOWMINIMIZED = 2; {最小化視窗,並將其激活}
  • •SW_SHOWMAXIMIZED = 3; {最大化視窗,並將其激活}
  • •SW_MAXIMIZE = 3; {同 SW_SHOWMAXIMIZED}
  • •SW_SHOWNOACTIVATE = 4; {用最近的大小和位置顯示一個視窗,不改變活動視窗}
  • •SW_SHOW = 5; {用當前的大小和位置顯示一個視窗,令其進入活動狀態}
  • •SW_MINIMIZE = 6; {最小化視窗, 不激活}
  • •SW_SHOWMINNOACTIVE = 7; {同 SW_MINIMIZE}
  • •SW_SHOWNA = 8; {用當前的大小和位置顯示一個視窗,不改變活動視窗}
  • •SW_RESTORE = 9; {同 SW_SHOWNORMAL}
  • •SW_SHOWDEFAULT = 10; {同 SW_SHOWNORMAL}
  • •SW_MAX = 10; {同 SW_SHOWNORMAL}

執行成功會返回應用程式句柄, 如果返回值 <= 32,則表示執行錯誤。返回值可能的錯誤有:

0—— {記憶體不足}

2—— {文件名錯誤}

3—— {路徑名錯誤}

11—— {EXE 文件無效}

26—— {發生共用錯誤}

27—— {文件名不完全或無效}

28—— {超時}

29—— {DDE 事務失敗}

30—— {正在處理其他 DDE 事務而不能完成該 DDE 事務}

31—— {沒有相關聯的應用程式}

2、查找窗體的句柄。在win32編程的世界里,包括視窗到文本框的所有控制項都是窗體,所有的窗體都有獨立的句柄。要操作任意一個窗體,都需要找到這個窗體的句柄。句柄是一個32位整數,在windows中用於標記對象。比如查找Snipping Tool和New Text Document.txt的句柄,如下所示:

para_hld = win32gui.FindWindow(None, "Snipping Tool")# 1836416
para_hld = win32gui.FindWindow(None, "New Text Document.txt - Notepad")# 591410

win32gui.FindWindow()屬於win32gui的模塊,它自頂層視窗(也就是桌面)開始搜索條件匹配的窗體,並返回這個窗體的句柄。該函數僅能查找主視窗,因此無法搜索子視窗,也不區分大小寫,未找到則返回0。

win32gui.FindWindow()的參數主要包括 (lpClassName=None, lpWindowName=None):

•lpClassName:字元型,窗體的類名,可以在Spy++里找到

•lpWindowName:字元型,視窗名,也就是標題欄上能看見的那個標題。

 

 

3、查找句柄的類名和標題。比如通過Snipping Tool和New Text Document.txt的句柄查找對應的類名和標題,如下所示:

title = win32gui.GetWindowText(1836416)
classname = win32gui.GetClassName(1836416)
print "windows handler:{0}; title:{1}; classname:{2}".format(1836416, title, classname)

列印顯示如下:

windows handler:1836416; title:Snipping Tool; classname:Microsoft-Windows-Tablet-SnipperToolbar
title = win32gui.GetWindowText(591410)
classname = win32gui.GetClassName(591410)
print "windows handler:{0}; title:{1}; classname:{2}".format(591410, title, classname)

列印顯示如下:

windows handler:591410; title:New Text Document.txt - Notepad; classname:Notepad

4、調用win32gui.EnumWindows()枚舉所有視窗句柄,直到最後一個頂層視窗被枚舉則停止枚舉過程。如下所示:

hWndList = []
win32gui.EnumWindows(lambda hWnd, param: param.append(hWnd), hWndList)
print hWndList
for hwnd in hWndList:
 title = win32gui.GetWindowText(hwnd)
 print title

列印顯示如下:

[852802L, 65946L, 65928L, 65930L, 65900L, 65920L, 65924L, 65922L, 65944L, 65892L, 65886L, 6817870L, 65960L, 6031410L, …… 66052L, 65734L]
……
New Text Document.txt - Notepad
Snipping Tool
DDE Server Window
OfficePowerManagerWindow
OfficePowerManagerWindow
DDE Server Window
GDI+ Window
Global Internet Access
……

5、win32gui.SetForegroundWindow()函數將指定窗體設置到最頂層,並且激活該視窗。

構造函數為:win32gui.SetWindowPos(HWN hWnd,HWND hWndlnsertAfter, int X,int Y, int cx,int cy, UNIT.Flags)

關於win32gui.SetForegroundWindow(para_hld)報錯的問題:

pywintypes.error: (0, ‘SetForegroundWindow’, ‘No error message is available’)

其實調用SetForegroundWindow()會有很多限制,參考官網的說明:

 

 

因此調用SetForegroundWindow()時需要查看當前運行的條件是否符合上述要求,此處在調用SetForegroundWindow()前事先發送一個鍵盤event來解決該問題。

常式如下所示:

win32api.keybd_event(13, 0, 0, 0) #
win32gui.SetForegroundWindow(para_hld)

6、win32api.keybd_event()模擬鍵盤輸入。

構造函數如下所示:

win32api.keybd_event (bVk, bScan, dwFlags, dwExtraInfo)

•bVk:虛擬鍵碼(鍵盤鍵碼對照表見附錄);

•bScan:硬體掃描碼,一般設置為0即可;

•dwFlags:函數操作的一個標誌位,如果值為KEYEVENTF_EXTENDEDKEY則該鍵被按下,也可設置為0即可,如果值為KEYEVENTF_KEYUP則該按鍵被釋放;

•dwExtraInfo:定義與擊鍵相關的附加的32位值,一般設置為0即可。

按下enter鍵後抬起的常式如下所示:

win32api.keybd_event(13,0,0,0) # enter
win32api.keybd_event(13,0,win32con.KEYEVENTF_KEYUP,0) #釋放按鍵

7、模擬滑鼠輸入。直接給出常式,如下所示:

# 獲取滑鼠當前位置的坐標
print win32api.GetCursorPos()
# 將滑鼠移動到坐標處
win32api.SetCursorPos((100, 100))
# 左點擊
win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN, 100, 100, 0, 0)
time.sleep(2)
win32api.mouse_event(win32con.MOUSEEVENTF_LEFTUP, 100, 100, 0, 0)

8、關於滑鼠鍵盤的操作還可以使用PyUserInput庫。PyUserInput是一個使用python的跨平臺的操作滑鼠和鍵盤的模塊,使用非常方便。支持的平臺及依賴如下:

•Linux - Xlib

•Mac - Quartz, AppKit

•Windows - pywin32, pyHook

實例化一個滑鼠和鍵盤對象,如下所示:

from pymouse import PyMouse
from pykeyboard import PyKeyboard
m = PyMouse()
k = PyKeyboard()
操作滑鼠和鍵盤,如下所示:
m.click(190,70,1)#移動並且在xy位置點擊
time.sleep(2)
m.click(190, 200, 1)#移動並且在xy位置點擊
time.sleep(2)
k.tap_key(k.function_keys[5])#–點擊功能鍵F5

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • part1複習 JavaScript分三個部分: 1. ECMAScript標準 JS基本的語法 2. DOM:Document Object Model 文檔對象模型 3. BOM:瀏覽器對象模型 DOM的作用: 操作頁面的元素 DOM樹: 把html頁面或者是xml文件看成是一個文檔,文檔就是一 ...
  • 安裝完上述插件之後,就可以進行引用了 如果源碼出現以下錯誤:則說明sass版本過高,只需要調為較低版本即可。實證有效版本:7.3.1 修改之後刪除 文件夾 然後 重新下載 即可 TypeError: this.getResolve is not a function ...
  • 一、寫在前頭 接到某廠電話問什麼是事件代理的時候,一開始說addEventListener,然後他說直接綁定新的元素不會報dom不存在的錯誤嗎?然後我就混亂了,我印象中這個方法是可以綁定新節點的。後面才知道,原來他要考察的是事件委托(代理)的原理,他指的是未來還不清楚會創建多少個節點,所以沒辦法實現 ...
  • 首先是typeorm的官方地址, 國內有人翻了中文版,不保證時效性 ·通過npm安裝下列包: typeorm //typeorm連接資料庫 @types/node //類型系統 typescript //ts基礎 oracledb //oracle基礎 ts-node //nodejs編譯運行ts的 ...
  • 慕課網 實戰班 就業班 2019年12月5號 更新資料整理 300套 百度網盤資料鏈接: 鏈接:https://pan.baidu.com/s/1qORPsgM6ukDPOSjU5ck5yA提取碼:qnlu複製這段內容後打開百度網盤手機App,操作更方便哦 微雲鏈接: https://docs.qq ...
  • 從 2004 年發佈 1.0 版本開始,Spring 目前已經演進至 5.x 版本了,為不同時期的應用開發提供了強有力的支撐。現在我們正面對微服務、DevOps、雲計算這些新的挑戰,Spring 家族的新生力量 Spring Cloud 又將給我們提供哪些方面的支撐呢? ...
  • Spring Cloud,它將幫我們填平橫跨在應用開發與微服務、DevOps、雲計算之間的溝壑,讓我們輕鬆擁抱雲上微服務,但你知道它是如何做到的嗎?你對它有全面的瞭解嗎?你知道如何正確使用它嗎?新概念新技術層出不窮,讓人雲里霧裡,你是否想撥開雲霧對它們有更清晰的認知? ...
  • 類的變數分成2種: 1、成員變數 概念:在構造方法中的變數,前面帶有self 作用:可以在類中不同的方法間使用 2、類變數-靜態變數 概念:在類中,構造方法和普通方法之外,定義的變數 作用: 1、調用 1、類名可以調用 類名.類變數 2、對象名也可以調用 對象名.類變數 ... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...