好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

来源:https://www.cnblogs.com/python0921/archive/2020/05/09/12859609.html
-Advertisement-
Play Games

前言 記錄一下如何用python爬取app數據,本文以爬取抖音視頻app為例。 編程工具:pycharm app抓包工具:mitmproxy app自動化工具:appium 運行環境:windows10 思路: 假設已經配置好我們所需要的工具 1、使用mitmproxy對手機app抓包獲取我們想要的 ...


 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

前言

記錄一下如何用python爬取app數據,本文以爬取抖音視頻app為例。

編程工具:pycharm

app抓包工具:mitmproxy

app自動化工具:appium

運行環境:windows10

思路:

假設已經配置好我們所需要的工具

1、使用mitmproxy對手機app抓包獲取我們想要的內容

2、利用appium自動化測試工具,驅動app模擬人的動作(滑動、點擊等)

3、將1和2相結合達到自動化爬蟲的效果

# mitmproxy/mitmdump抓包

確保已經安裝好了mitmproxy,並且手機和PC處於同一個區域網下,同時也配置好了mitmproxy的CA證書,網上有很多相關的配置教程,這裡我就略過了。

因為mitmproxy不支持windows系統,所以這裡用的是它的組件之一mitmdump,它是mitmproxy的命令行介面,可以利用它對接我們的Python腳本,用Python實現監聽後的處理。

在配置好mitmproxy之後,在控制臺上輸入mitmdump併在手機上打開抖音app,mitmdump會呈現手機上的所有請求,如下圖

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

可以在抖音app一直往下滑,看mitmdump所展示的請求,會發現首碼分別為

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

這3個類型首碼的url正是我們的目標抖音視頻url。

那接下來就要編寫python腳本將視頻下載下來,需要使用 mitmdump -s scripts.py(此處為python文件名)來執行腳本。

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

代碼寫得比較粗糙,不過基本的邏輯還是比較清晰的,這樣我們就可以把抖音的視頻下載下來,不過這個方法有個缺陷,就是獲取視頻需要人來不斷地滑動抖音的下一個視頻,這時候我們可以用一個強大的appium自動化測試工具來解決。

# Appium對手機進行模擬操作

確保已經配置好appium所依賴的環境Android和SDK,網上也有許多教程,這裡我就不說了。

appium的用法很簡單,首先我們先打開appium,啟動界面如下

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

點擊Start Server按鈕即可啟動appium服務

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

將Android手機通過數據線與PC相連,同時打開USE調試功能,可以輸入adb命令(具體可以去網上查找)測試連接情況,若出現以下結果,則說明連接成功

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

model是設備名,後面配置需要用到。之後點擊下圖箭頭所指的按鈕就會出現一個配置頁面

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

在右下角的JSON Representation配置啟動app的Desired Capabilities參數,分別是paltformName、deviceName、appPackage、appActivity。

platformName:平臺名稱,一般是Android或iOS.

deviceName:設備名稱,手機的具體類型

appPackage:App程式包名

appActivity:入口Activity名,通常以.開頭

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

platformName和deviceName比較容易獲得,而appPackage和appActivity這兩個可以通過以下方法獲取到。

在控制臺上輸入 adb logcat>D:\log.log 命令,並且在手機打開抖音app,然後在D盤中打開log.log文件,查找Displayed關鍵字

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

由上圖可以知道Displayed後面的 com.ss.android.ugc.aweme對應的是appPackage,.main.MainActivity對應的是appActivity,最後我們的配置結果如下:

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

再點擊Start Session即可啟動Android手機上的抖音app併進入到啟動頁面,同時PC上會彈出一個調試視窗,從這個視窗可以預覽當前手機頁面,還可以對手機模擬各種操作,在本文不是重點,所以略過。

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

在下麵我們將使用python腳本來驅動app,直接在pycharm運行即可

 

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱

 

效果如下圖:

好看的抖音小視頻不小心手滑刷過去了怎麼辦?Python幫你解決煩惱    

不管你是零基礎還是有基礎都可以獲取到自己相對應的學習禮包!包括Python軟體工具和2020最新入門到實戰教程。加群695185429即可免費獲取。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 6.20(計算一個字元串中字母的個數)編寫一個方法,使用下麵的方法頭計算字元串中的字母個數: public static int countLetters(String s) 編寫一個測試程式,提示用戶輸入字元串,然後顯示字元串中的字母個數。 6.20(Count the letters in a ...
  • 說點什麼呢,java比你想的要難 寫了多年java,發現好多人並不知道一個class文件怎麼被解析執行的,所以我也發表下看法 1. 編寫java源文件 ​ 2. 把java源文件編譯成.class位元組碼文件,JVM不認識源文件 ​ 3. JVM處理class文件 搞java開發,不得不提的就是JVM ...
  • 設置表名為中文 1.設置Models.py文件 重啟服務,訪問admin後臺,就能看到中文名字了,如下圖: 設置App(應用)為中文 1. 修改要修改的應用目錄下的apps.py 2. 修改要修改的應用目錄下的__init__.py文件 重啟服務,訪問admin後臺,就能看到中文名字了,如下圖: 本 ...
  • 1.運算符的優先順序 運算符的優先順序在考試中會考,瞭解即可,多用就會熟能生巧 實際使用過程中建議用小括弧來分優先順序 關鍵就是:邏輯非>邏輯與>邏輯或 2.數據類型的轉換 數據類型的轉換分為自動類型轉換和強制類型轉換 1.自動類型轉換:容量小的數據類型可以自動轉換為容量大的數據類型 如圖所示:虛線表示轉 ...
  • 概念:所謂質數就是只能被1和它本身整除的數。那麼對於某一個數a,可以試著讓它除以a-1......2,如果有任意一次除法的餘數為零,這個數a就不是質數。 方法一: 完全根據質數的定義,我稱這種方法叫做“笑而不語最直接法”。該方法完全可以輸出正確結果,但這肯定不是面試官想要的 public stati ...
  • 1.關鍵字transient 1)一旦變數被transient修飾,變數將不再是對象持久化的一部分,該變數內容在序列化後無法獲得訪問。 2)transient關鍵字只能修飾變數,而不能修飾方法和類。註意,本地變數是不能被transient關鍵字修飾的。變數如果是用戶自定義類變數,則該類需要實現Ser ...
  • Spring框架是一個為Java應用程式的開發提供了綜合、廣泛的基礎性支持的Java平臺。Spring幫助開發者解決了開發中基礎性的問題,使得開發人員可以專註於應用程式的開發。 近兩年來,許多大廠在面試中都會頻繁問到Spring相關,記得第一次去阿裡面試時,可以說是慘遭“虐待”,被面試官逼問得啞口無 ...
  • 1.運算符的分類 1.算術運算符:+(加法)、-(減法)、*(乘法)、/(除法)、%(取模/取餘)、++(自增)、--(自減) 2.賦值運算符:=(賦值)、+=(加等)、-=(減等)、*=(乘等)、/=(除等)、%=(模等/取餘等) 3.關係運算符:>(大於)、<(小於)、>=(大於等於)、<=(小 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...