用Python爬取"王者農藥"英雄皮膚

-Advertisement-

作為一款現象級游戲，王者榮耀，想必大家都玩過或聽過，游戲里中各式各樣的英雄，每款皮膚都非常精美，用做電腦壁紙再合適不過了。本篇就來教大家如何使用Python來爬取這些精美的英雄皮膚。關註公眾號「**Python專欄**」，後臺回覆「**zsxq04**」，獲取本文全套源碼！ ...

王者榮耀

0.引言

作為一款現象級游戲，王者榮耀，想必大家都玩過或聽過，游戲里中各式各樣的英雄，每款皮膚都非常精美，用做電腦壁紙再合適不過了。本篇就來教大家如何使用Python來爬取這些精美的英雄皮膚。

1.環境

操作系統：Windows / Linux

Python版本：3.7.2

2.需求分析

我們打開《王者榮耀》官網，找定位到英雄列表的頁面

可直接點此鏈接：

https://pvp.qq.com/web201605/herolist.shtml 王者榮耀

在這個網頁中包含了所有的英雄，頭像及英雄名稱。點擊其中一個英雄的頭像，如“嫦娥”，進去後如下圖：

王者榮耀

我們記下此時的網址

https://pvp.qq.com/web201605/herodetail/515.shtml

再後退到英雄列表頁面，點“甄姬”進去查看：

https://pvp.qq.com/web201605/herodetail/127.shtml

可以看到這些網址幾乎是固定不變的，變化的只是515、127這些數字，這些其實就是代表的英雄數字編號。

那麼第一個關鍵點就來了，怎麼找出各個英雄所對應的數字編號呢？

我們回到最初的英雄列表頁面，打開瀏覽器的開發者工具，刷新頁面、仔細觀察，你會找到一個herolist.json的文件，如圖所示：

python爬蟲

這裡記錄了各個英雄的信息，其中就包含了每個英雄對應的數字編號了，請忽略這裡截圖中的亂碼顯示。我們切到herolist.json中的Headers，就可以拿到該請求的URL地址，進而就可以把英雄及其對應的數字，編號都提取出來了。

有了英雄編號的對應關係，再找尋下英雄皮膚的鏈接規律。

現在重新進入一個英雄的網址，打開瀏覽器的開發者工具，刷新頁面，在Network下刷新並找到英雄的皮膚圖片，如圖所示：

在這裡插入圖片描述

在Headers中查看該圖片的網址，查看即Request URL處的鏈接：

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/515/515-bigskin-1.jpg

找尋一個看看

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/529/529-bigskin-1.jpg

繼續尋一個看看

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/127/127-bigskin-4.jpg

仔細分析如上三個鏈接，我們可以把英雄皮膚的URL拆分開來看。它是由一個固定首碼（我們可以記為base_url），再加上英雄數字編號、"bigskin"、皮膚編號、".jpg"組合而成，如下：

base_url / hero_num / hero_num - bigskin - heroskin_num .jpg

拿到了各個英雄皮膚的URL地址後，我們就可以進行圖片的下載並保存在本地了。

3.代碼演示

首先導入我們所用到的模塊

import requests

import os

註：requests是非內置模塊，若環境中沒有，需自行安裝：

pip install requests

3.1 提取英雄名字及數字

使用herolist.json拿到herolist，並提取出我們關心的內容

# 英雄的名字json

url = 'http://pvp.qq.com/web201605/js/herolist.json'


head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
response = requests.get(url, headers=head)
hero_list = response.json()

# 提取英雄名字和數字
hero_name=list(map(lambda x:x['cname'], hero_list)) 

hero_number=list(map(lambda x:x['ename'], hero_list))

3.2 構造英雄皮膚的URL

首先準備好我們的BASE_URL，即英雄皮膚的固定首碼。

h_l='http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'

接下來構造好英雄皮膚的URL，同時我們需要對每一個英雄的所有皮膚進行遍歷，如下：

# 逐一遍歷英雄
for i in hero_number:
# 逐一遍歷皮膚，此處假定一個英雄最多有15個皮膚
for sk_num in range(15):
hsl = h_l + str(i)+'/'+str(i)+'-bigskin-'+str(sk_num)+'.jpg'

hl = requests.get(hsl)

3.3 存儲圖片

最後我們就只需將獲取到的圖片保存在本地即可。

# 將圖片保存下來，並以"英雄名稱_皮膚序號"方式命名
with open(hero_name[num] + str(sk_num) + '.jpg', 'wb') as f:
f.write(hl.content)

4.效果展示

最終的爬取效果如下圖所示。

在這裡插入圖片描述

5.總結

短短幾十行代碼就可以把心愛英雄的精美皮膚保存下來，趕快實操起來吧！

關註公眾號「Python專欄」，後臺回覆「zsxq04」，獲取本文全套源碼！

Python專欄二維碼

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

面向對象課程第一單元總結

說來慚愧，在很久之前修這門課程的時候總是不能理解面向對象辯證思想的精髓所在，又沒有用軟體開發的標準嚴格要求自己，所以導致寫了一些類C程式後草草收場。時隔多年，課程的風格變化與老師和平臺提供的幫助，加上今年對於Java語言上更熟練的使用，讓我在第一個單元的學習中得到了很多，雖然並不能像大神一樣總結出技 ...
C++ 標準和 C 標準（截止到2019年03月）

C++ 標準：維基百科 C 標準：維基百科【K&R C】 1978 年，Dennis Ritchie 和 Brian Kernighan 合作推出了《The C Programming Language》的第一版(按照慣例，經典著作一定有簡稱，該著作簡稱為 K&R)，書末的參考指南 (Refere ...
Windows10配置JDK環境變數

一. 系統和JDK版本系統：Windows10 JDK版本：1.8 二. 配置步驟 1. 右鍵單擊“我的電腦” >> 屬性 >> 高級系統設置 2. 環境變數 3. 系統變數 >>新建 4.新建變數名“JAVA_HOME”，變數值為JDK的安裝路徑 5. 編輯Path環境變數，添加“%JAVA_H ...
Java面試總結

背景：人生不可以後悔，但它卻可以轉彎。不知不覺到新的公司上班已經一個多星期了，然而之前面試了好幾家公司都沒有好好總結下；新公司給我的總體印象還不錯，是一家非外包的創業型企業，就是公司是做大數據項目的，之前我是搞Java開發的，然後現在自己hadoop不瞭解、Linux不熟悉、測試用例也沒寫過等，搞得 ...
OpenJudge 4001:抓住那頭牛

"題目鏈接" 題解：這個題可以用廣搜來解決，從農夫到牛的走法每次都有三種選擇，定義一個隊列，把農夫的節點加進隊列，然後以這三種走法找牛，隊列先進先出，按順序直到找到牛的位置。代碼： c++ include include include include using namespace std; ...
PHP+Ajax+plupload無刷新上傳頭像代碼

很簡單的一款PHP+Ajax+plupload無刷新上傳頭像代碼，相容性很好，可以直接拿來用。你可以自定義各種類型的文件。本實例中只能上傳"jpg", "png", "gif", "jpeg"等圖片文件引入jQuery庫和plupload上傳組件 plupload單圖片上傳配置本實例下載：htt ...
Python基礎學習之Python主要的數據分析工具總結

Python主要是依靠眾多的第三方庫來增強它的數據處理能力的。常用的是Numpy庫，Scipy庫、Matplotlib庫、Pandas庫、Scikit-Learn庫等。常規版本的python需要在安裝完成後另外下載相應的第三方庫來安裝庫文件。而若安裝的是Anaconda版本的Python，則不需要 ...
【代碼】Django學習筆記

一些設置setting.py 運行項目內應用測試模塊tests.py，報錯處理如下： ...