記一次 爬取LOL全皮膚原畫保存到本地的實例

来源:https://www.cnblogs.com/llww/archive/2020/01/04/12149699.html
-Advertisement-
Play Games

1 #爬取lol全英雄皮膚 2 import re 3 import traceback # 異常跟蹤 4 import requests 5 from bs4 import BeautifulSoup 6 #獲取html 7 def get_url(url, hander): 8 try: 9 r ...


 1 #爬取lol全英雄皮膚
 2 import re
 3 import traceback #  異常跟蹤
 4 import requests
 5 from bs4 import BeautifulSoup
6 #獲取html 7 def get_url(url, hander): 8 try: 9 r = requests.get(url, headers=hander, timeout=30) 10 r.raise_for_status() 11 r.encoding = r.apparent_encoding 12 return r.text 13 except: 14 traceback.print_exc() #將異常信息列印出來 15 return "" 16 #解析html 17 def prasing_page(lst,html): 18 try: 19 soup = BeautifulSoup(html, "html.parser") 20 for a in soup.find_all('li', class_=re.compile('boxShadow')): 21 tag_a = a('a') 22 for i in tag_a: 23 lst.append(i['href']) 24 return lst 25 except: 26 traceback.print_exc() 27 return ""

28 #解析獲取到的單個html並篩選和下載 29 def getUrl_prasingpag(lst, hander): 30 hero_img_url = [] 31 hero_skin_name = [] 32 hero_name = [] 33 for u in lst: 34 try: 35 r = requests.get(u, headers=hander, timeout=30) 36 r.raise_for_status() 37 r.encoding = r.apparent_encoding
38        #二次解析 39 soup = BeautifulSoup(r.text, "html.parser") 40 pag = soup.find_all('div', class_=re.compile('othersPifuBox')) 41 for m in pag: 42 tag_img = m('img') 43 tag_p = m('p') 44 tag_span = m('span') 45 for m in tag_p: 46 hero_skin_name.append(m.string) 47 for m in tag_img: 48 hero_img_url.append(m['src']) 49 for m in tag_span: 50 hero_name.append(m.string) 51 except: 52 traceback.print_exc() # 將異常信息列印出來 53 continue 54       
        #下載到本地
55 for i in range(len(hero_name)): 56 try: 57 path = 'O:/lol_hero_jpg/' + hero_skin_name[i]+'--' + hero_name[i] + '.jpg' 58 f = open(path, 'wb') 59 r = requests.get(hero_img_url[i], stream=True) 60 f.write(r.content) 61 print("\r當前進度>>>>>>>>>>>>>>>>>>{:.0f}%>>>>>>>>>>>>>>>>>>".format(i * 100 / len(lst)), end="") 62 f.close() 63 except: 64 traceback.print_exc() # 將異常信息列印出來 65 continue 66 67 def main(): 68 hander = {"User-Agent":"Mozilla/5.0"} 69 deep = 43 #定義爬取頁數 70 list = [] 71 for i in range(deep): 72 try: 73 url = "http://********/hero_"+str(1+i)+".shtml" 74 html = get_url(url, hander) 75 prasing_page(list, html) 76 getUrl_prasingpag(list, hander) 77 except: 78 continue 79 80 main()

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 操作步驟:滑鼠右擊項目(註意是項目)->添加->引用->項目(在項目列表中選擇需要引用的項目)->確定 ...
  • 1.install-package log4net 2.add new config file, its name is log4net.config <?xml version="1.0" encoding="utf-8" ?><configuration> <log4net> <root> <l ...
  • 本文將介紹如何在.NET Core3環境下使用MVVM框架Prism的命令的用法 一.創建DelegateCommand命令 我們在上一篇.NET Core 3 WPF MVVM框架 Prism系列之數據綁定中知道prism實現數據綁定的方式,我們按照標準的寫法來實現,我們分別創建Views文件夾和 ...
  • 1背景介紹 最近有開發數據統計的網站,老闆需及時投放到顯示屏,但程式仍需改動,只能先部署到區域網,測試產品不能部署伺服器(伺服器負擔過重) 開發框架MVC4+sql server+echarts,由於需每隔5分鐘刷新,還有ajax,手寫ajax+echarts調用生成圖表,話不多說,上圖。 2 部署 ...
  • 實現DataTable轉TXT文件代碼如下: public ExecutionResult DataTableToTxt(DataTable vContent, string vOutputFilePath) { ExecutionResult sResult = new ExecutionResu ...
  • C#代碼實現把Excel文件轉化為DataTable,根據Excel的文件尾碼名不同,用不同的方法來進行實現,下麵通過根據Excel文件的兩種尾碼名(*.xlsx和*.xls)分別來實現。獲取文件尾碼名的方法是:Path.GetExtension(fileName)方法,通過引用:using Sys ...
  • WPF繼續響應被標記為已處理事件的方法 WPF中在冒泡事件或者隧道事件會隨其層間關係在visual tree上層層傳遞,但是,某些事件傳遞到某些控制項是即會”終止“(不再響應相應的註冊事件),給人一種事件終結者的印象。例如:textbox對mousdown事件。 產生原因:事件處理到達該控制項後,其事件 ...
  • 用uefi裝了幾次次archlinux,搞的uefi啟動選項下多出來好多啟動項。。這東西重格硬碟也是不好用的。發現以下方法可以解決。 efibootmgr //顯示efi的啟動項 刪除一個引導項 # efibootmgr -b 0001 -B 其中 0001是要刪除的引導項編號,通過 efiboot ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...