Python獲取手機4K壁紙，一個入門練手的案例

-Advertisement-

前言一. 數據來源分析明確需求, 我們採集網上什麼數據內容, 在什麼地方分析我們想要高清原圖在什麼地方有瀏覽器自帶工具: 開發者工具 F12 滑鼠右鍵點擊插件選擇 network 刷新網頁點擊選擇 Img 可以直接找到圖片地址通過搜索分析, 可以知道, 我們想要圖片原圖url 就在 ...

前言

一. 數據來源分析

明確需求, 我們採集網上什麼數據內容, 在什麼地方

分析我們想要高清原圖在什麼地方有

瀏覽器自帶工具: 開發者工具 F12

滑鼠右鍵點擊插件選擇 network 刷新網頁

點擊選擇 Img 可以直接找到圖片地址

通過搜索分析, 可以知道, 我們想要圖片原圖url 就在圖片詳情頁網頁源代碼裡面

二. 代碼大概實現步驟

發送請求, 模擬瀏覽器對於圖片目錄頁面發送請求

獲取數據, 獲取伺服器返迴響應數據

解析數據, 提取我們想要數據內容

發送請求, 模擬瀏覽器對於圖片詳情頁url 發送請求

獲取數據, 獲取伺服器返迴響應數據

解析數據, 提取我們想要數據內容

保存數據, 把圖片保存文本文件夾

對於本篇文章有疑問的同學可以加【資料白嫖、解答交流群：753182387】

代碼實現

導入模塊

import requests
import re

請求數據

url = f'https://m.bcoderss.com/tag/漫畫/page/1/'
# 模擬瀏覽器 --> headers 請求頭
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
# 發送請求
response = requests.get(url=url, headers=headers)

<Response [200]> 表示請求成功

解析數據, 提取我們想要數據內容

提取詳情頁url地址

img_info = re.findall('<li><a target="_blank" href="(.*?)" alt="(.*?)" title=".*?">', response.text)

for迴圈遍歷把列表裡面元素一個一個提取出來

for img, title in img_info:
    html_data = requests.get(url=img, headers=headers).text
    # 提取原圖url地址
    img_url = re.findall('<img alt=".*?" title=".*?" src="(.*?)">', html_data)[0]

獲取二進位數據

img_content = requests.get(url=img_url).content

替換特殊字元

img_title = title + img_url.split('/')[-1]
img_title = re.sub(r'[\/:*?:<>|]', '_', img_title)

保存數據

with opythonpen('img漫畫\\' + img_title, mode='wb') as f:
    f.write(img_content)
print(img_url, img_title)

運行代碼

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

全球名校AI課程庫（16）| Stanford斯坦福 · 電腦科學導論課程『Introduction to Computers』

循序漸進地介紹了電腦方向的大部分基礎知識，包括計算設備的工作原理、諸多實用技能(包括網頁開發等)，適合初學者構建對電腦科學的全面認知。 ...
python3使用mutagen進行音頻元數據處理

python版本：python 3.9 mutagen版本：1.46.0 mutagen是一個處理音頻元數據的python模塊，支持多種音頻格式，是一個純粹的python庫，僅依賴python標準庫，可在Python 3.7及以上版本運行，支持Linux、Windows 和 macOS系統。 git ...
day52-正則表達式03

正則表達式03 5.6正則表達式三個常用類 java.util.regex 包主要包括以下三個類：Pattern類、Matcher類和PatternSyntaxException類 Pattern類 Pattern對象是一個正則表達式對象。Pattern類沒有公共構造方法，要創建一個Pattern對 ...
JVM中的進程和線程

Alwaysblock1 組合邏輯always塊的使用，註意這裡的wire和reg綜合出來的結果是一樣的，這裡只是verilog語法導致二者聲明不一樣。 // synthesis verilog_input_version verilog_2001 module top_module( input ...
OpenGL 反色

目錄一.OpenGL 反色 1.IOS Object-C 版本 2.Windows OpenGL ES 版本 3.Windows OpenGL 版本二.OpenGL 反色 GLSL Shader 三.猜你喜歡零基礎 OpenGL ES 學習路線推薦 : OpenGL ES 學習目錄 >> Op ...
R語言、04 案例P143 Go bananas、《商務與經濟統計》案例題

編程教材《R語言實戰·第2版》Robert I. Kabacoff 課程教材《商務與經濟統計·原書第13版》 (安德森) P143、案例 Go Bananas #1 生產中斷的概率 c <- pbinom(4, 25, .08) # 4 是預設 P(x <= 4) answer1 <- 1 - c ...
Java 8 函數式介面和Lambda表達式

Java 一直是一種面向對象的編程語言。這意味著 Java 編程中的一切都圍繞著對象(為了簡單起見，除了一些基本類型)。我們不僅有 Java 中的函數，它們還是 Class 的一部分，我們需要使用 class/object 來調用任何函數。函數式介面當我們研究一些其他的編程語言時，比如C++，J ...
python做了個自動關機工具，再也不會耽誤我下班啦

在筆者前面有一篇文章`《驅動開發：斷鏈隱藏驅動程式自身》`通過摘除驅動的鏈表實現了斷鏈隱藏自身的目的，但此方法恢復時會觸發PG會藍屏，偶然間在網上找到了一個作者介紹的一種方法，覺得有必要詳細分析一下他是如何實現的進程隱藏的，總體來說作者的思路是最終尋找到`MiProcessLoaderEntry`的... ...