Python爬蟲教程-爬取5K解析度超清唯美壁紙源碼

来源:https://www.cnblogs.com/ITbiancheng/archive/2020/02/07/12273240.html
-Advertisement-
Play Games

壁紙的選擇其實很大程度上能看出電腦主人的內心世界,有的人喜歡風景,有的人喜歡星空,有的人喜歡美女,有的人喜歡動物。 ...


簡介

壁紙的選擇其實很大程度上能看出電腦主人的內心世界,有的人喜歡風景,有的人喜歡星空,有的人喜歡美女,有的人喜歡動物。然而,終究有一天你已經產生審美疲勞了,但你下定決定要換壁紙的時候,又發現網上的壁紙要麼解析度低,要麼帶有水印。

項目源碼

  1 # -*- coding:utf-8 -*-
  2 
  3 from requests import get
  4 from filetype import guess
  5 from os import rename
  6 from os import makedirs
  7 from os.path import exists
  8 from json import loads
  9 from contextlib import closing
 10 
 11 
 12 # 文件下載器
 13 def Down_load(file_url, file_full_name, now_photo_count, all_photo_count):
 14     headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
 15 
 16     # 開始下載圖片
 17     with closing(get(file_url, headers=headers, stream=True)) as response:
 18         chunk_size = 1024  # 單次請求最大值
 19         content_size = int(response.headers['content-length'])  # 文件總大小
 20         data_count = 0 # 當前已傳輸的大小
 21         with open(file_full_name, "wb") as file:
 22             for data in response.iter_content(chunk_size=chunk_size):
 23                 file.write(data)
 24                 done_block = int((data_count / content_size) * 50)
 25                 data_count = data_count + len(data)
 26                 now_jd = (data_count / content_size) * 100
 27                 print("\r %s:[%s%s] %d%% %d/%d" % (file_full_name, done_block * '', ' ' * (50 - 1 - done_block), now_jd, now_photo_count, all_photo_count), end=" ")
 28 
 29     # 下載完圖片後獲取圖片擴展名,併為其增加擴展名
 30     file_type = guess(file_full_name)
 31     rename(file_full_name, file_full_name + '.' + file_type.extension)
 32 
 33 
 34 
 35 # 爬取不同類型圖片
 36 def crawler_photo(type_id, photo_count):
 37 
 38     # 最新 1, 最熱 2, 女生 3, 星空 4
 39     if(type_id == 1):
 40         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c68ffb9463b7fbfe72b0db0?page=1&per_page=' + str(photo_count)
 41     elif(type_id == 2):
 42         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c69251c9b1c011c41bb97be?page=1&per_page=' + str(photo_count)
 43     elif(type_id == 3):
 44         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c81087e6aee28c541eefc26?page=1&per_page=' + str(photo_count)
 45     elif(type_id == 4):
 46         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c81f64c96fad8fe211f5367?page=1&per_page=' + str(photo_count)
 47 
 48     # 獲取圖片列表數據
 49     headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
 50     respond = get(url, headers=headers)
 51     photo_data = loads(respond.content)
 52 
 53     # 已經下載的圖片張數
 54     now_photo_count = 1
 55 
 56     # 所有圖片張數
 57     all_photo_count = len(photo_data)
 58 
 59     # 開始下載並保存5K解析度壁紙
 60     for photo in photo_data:
 61 
 62         # 創建一個文件夾存放我們下載的圖片
 63         if not exists('./' + str(type_id)):
 64             makedirs('./' + str(type_id))
 65 
 66         # 準備下載的圖片鏈接
 67         file_url = photo['urls']['raw']
 68 
 69         # 準備下載的圖片名稱,不包含擴展名
 70         file_name_only = file_url.split('/')
 71         file_name_only = file_name_only[len(file_name_only) -1]
 72 
 73         # 準備保存到本地的完整路徑
 74         file_full_name = './' + str(type_id) + '/' + file_name_only
 75 
 76         # 開始下載圖片
 77         Down_load(file_url, file_full_name, now_photo_count, all_photo_count)
 78         now_photo_count = now_photo_count + 1
 79 
 80 
 81 
 82 if __name__ == '__main__':
 83 
 84     # 最新 1, 最熱 2, 女生 3, 星空 4
 85     # 爬取類型為3的圖片(女生),一共準備爬取20000張
 86     wall_paper_id = 1
 87     wall_paper_count = 10
 88     while(True):
 89 
 90         # 換行符
 91         print('\n\n')
 92 
 93         # 選擇壁紙類型
 94         wall_paper_id = input("壁紙類型:最新壁紙 1, 最熱壁紙 2, 女生壁紙 3, 星空壁紙 4\n請輸入編號以便選擇5K超清壁紙類型:")
 95         # 判斷輸入是否正確
 96         while(wall_paper_id  != str(1) and wall_paper_id  != str(2) and wall_paper_id  != str(3) and wall_paper_id  != str(4)):
 97             wall_paper_id = input("壁紙類型:最新壁紙 1, 最熱壁紙 2, 女生壁紙 3, 星空壁紙 4\n請輸入編號以便選擇5K超清壁紙類型:")
 98 
 99 
100         # 選擇要下載的壁紙數量
101         wall_paper_count = input("請輸入要下載的5K超清壁紙的數量:")
102         # 判斷輸入是否正確
103         while(int(wall_paper_count) <= 0):
104             wall_paper_count = input("請輸入要下載的5K超清壁紙的數量:")
105 
106 
107         # 開始爬取5K高清壁紙
108         print("正在下載5K超清壁紙,請稍等……")
109         crawler_photo(int(wall_paper_id), int(wall_paper_count))
110         print('\n下載5K高清壁紙成功!')

 

初學者對Python的概念模糊不清的,Python能做什麼,學的時候該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,詳情可以複製有道雲筆記鏈接到瀏覽器打開瞭解:http://note.youdao.com/noteshare?id=e4fa02e7b56d7909a27674cdb3da08aa

學習視頻資料、開發工具等都有免費分享,還有專業的老師答疑

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 註意:可變參數類型是在jdk1.5版本的新特性,數組類型是jdk1.0就有了。 這篇文章主要介紹了Java方法的可變參數類型,通過實例對Java中的可變參數類型進行了較為深入的分析,需要的朋友可以參考下。 Java方法中的可變參數類型是一個非常重要的概念,有著非常廣泛的應用。本文就以實例形式對此加以 ...
  • 併發編程之線程第一篇 3.4 原理之線程運行 線程上下文切換(Thread Context Switch) 3.5 常見方法 3.6 start與run 3.7 sleep與yield 案例 - 防止CPU占用100% 3.8 join方法詳解 3.9 interrupt方法詳解 兩階段終止模式 3 ...
  • notepad中運行python cmd /k python "$(FULL_CURRENT_PATH)" & ECHO. & PAUSE & EXIT notepad中運行python kALI 用: sudo apt get install ttf wqy zenhei kali安裝後出現亂碼 ...
  • 在MainModule里 Design 模式 1]RecallLastTheme 設為True 2]Theme選一個皮膚 總共有 classicgraycrispneptunetritontriton.modifiedariagraphite 8個預設皮膚 uses uniStrUtils, pro ...
  • SpringBoot官方不推薦使用jsp,因為jsp不好發揮SpringBoot的特性。官方推薦使用模板引擎代替jsp,現在很多公司都使用FreeMarker來作為SpringBoot的視圖。 SpringBoot對動態頁面的支持很好,為多種模板引擎提供了預設配置,常用的有: Thymeleaf F ...
  • Lamda表達式學習筆記一 一、Lamda語法詮釋 三傻大鬧寶萊塢的主人公蘭徹說的一句話讓我映像深刻:用簡單的語言來表達同樣的意 我並不是說書上的定義怎麼怎麼不對,而是應該理解書本上的定義,並用簡單的話語描述! 那麼正題來了,lamda表達式是什麼? 定義:lamda表達式是一個可傳遞的代碼塊,可以 ...
  • 1.單調隊列簡介: 單調隊列是一種數據結構,類似如單調棧,但裡面的元素必須在一個區間內,如果“過時”就要出隊。所以,單調隊列可以在兩端進行出隊,但只能再隊尾入隊。按此性質,傳統的隊列已無法滿足需求,需要使用雙端隊列,再C++的STL里,雙端隊列定義在deque里: #include <deque> ...
  • 效果圖: 左邊的樹 的樹結點 ,通過 結點名 與 右 側TabSheet名 一致時,顯示 相關頁面。 這是相關 源代碼 procedure TMainForm.UniFormCreate(Sender: TObject); var I: Integer; begin for I := UniPage ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...