Python爬蟲教程-爬取5K解析度超清唯美壁紙源碼

来源:https://www.cnblogs.com/ITbiancheng/archive/2020/02/07/12273240.html
-Advertisement-
Play Games

壁紙的選擇其實很大程度上能看出電腦主人的內心世界,有的人喜歡風景,有的人喜歡星空,有的人喜歡美女,有的人喜歡動物。 ...


簡介

壁紙的選擇其實很大程度上能看出電腦主人的內心世界,有的人喜歡風景,有的人喜歡星空,有的人喜歡美女,有的人喜歡動物。然而,終究有一天你已經產生審美疲勞了,但你下定決定要換壁紙的時候,又發現網上的壁紙要麼解析度低,要麼帶有水印。

項目源碼

  1 # -*- coding:utf-8 -*-
  2 
  3 from requests import get
  4 from filetype import guess
  5 from os import rename
  6 from os import makedirs
  7 from os.path import exists
  8 from json import loads
  9 from contextlib import closing
 10 
 11 
 12 # 文件下載器
 13 def Down_load(file_url, file_full_name, now_photo_count, all_photo_count):
 14     headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
 15 
 16     # 開始下載圖片
 17     with closing(get(file_url, headers=headers, stream=True)) as response:
 18         chunk_size = 1024  # 單次請求最大值
 19         content_size = int(response.headers['content-length'])  # 文件總大小
 20         data_count = 0 # 當前已傳輸的大小
 21         with open(file_full_name, "wb") as file:
 22             for data in response.iter_content(chunk_size=chunk_size):
 23                 file.write(data)
 24                 done_block = int((data_count / content_size) * 50)
 25                 data_count = data_count + len(data)
 26                 now_jd = (data_count / content_size) * 100
 27                 print("\r %s:[%s%s] %d%% %d/%d" % (file_full_name, done_block * '', ' ' * (50 - 1 - done_block), now_jd, now_photo_count, all_photo_count), end=" ")
 28 
 29     # 下載完圖片後獲取圖片擴展名,併為其增加擴展名
 30     file_type = guess(file_full_name)
 31     rename(file_full_name, file_full_name + '.' + file_type.extension)
 32 
 33 
 34 
 35 # 爬取不同類型圖片
 36 def crawler_photo(type_id, photo_count):
 37 
 38     # 最新 1, 最熱 2, 女生 3, 星空 4
 39     if(type_id == 1):
 40         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c68ffb9463b7fbfe72b0db0?page=1&per_page=' + str(photo_count)
 41     elif(type_id == 2):
 42         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c69251c9b1c011c41bb97be?page=1&per_page=' + str(photo_count)
 43     elif(type_id == 3):
 44         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c81087e6aee28c541eefc26?page=1&per_page=' + str(photo_count)
 45     elif(type_id == 4):
 46         url = 'https://service.paper.meiyuan.in/api/v2/columns/flow/5c81f64c96fad8fe211f5367?page=1&per_page=' + str(photo_count)
 47 
 48     # 獲取圖片列表數據
 49     headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
 50     respond = get(url, headers=headers)
 51     photo_data = loads(respond.content)
 52 
 53     # 已經下載的圖片張數
 54     now_photo_count = 1
 55 
 56     # 所有圖片張數
 57     all_photo_count = len(photo_data)
 58 
 59     # 開始下載並保存5K解析度壁紙
 60     for photo in photo_data:
 61 
 62         # 創建一個文件夾存放我們下載的圖片
 63         if not exists('./' + str(type_id)):
 64             makedirs('./' + str(type_id))
 65 
 66         # 準備下載的圖片鏈接
 67         file_url = photo['urls']['raw']
 68 
 69         # 準備下載的圖片名稱,不包含擴展名
 70         file_name_only = file_url.split('/')
 71         file_name_only = file_name_only[len(file_name_only) -1]
 72 
 73         # 準備保存到本地的完整路徑
 74         file_full_name = './' + str(type_id) + '/' + file_name_only
 75 
 76         # 開始下載圖片
 77         Down_load(file_url, file_full_name, now_photo_count, all_photo_count)
 78         now_photo_count = now_photo_count + 1
 79 
 80 
 81 
 82 if __name__ == '__main__':
 83 
 84     # 最新 1, 最熱 2, 女生 3, 星空 4
 85     # 爬取類型為3的圖片(女生),一共準備爬取20000張
 86     wall_paper_id = 1
 87     wall_paper_count = 10
 88     while(True):
 89 
 90         # 換行符
 91         print('\n\n')
 92 
 93         # 選擇壁紙類型
 94         wall_paper_id = input("壁紙類型:最新壁紙 1, 最熱壁紙 2, 女生壁紙 3, 星空壁紙 4\n請輸入編號以便選擇5K超清壁紙類型:")
 95         # 判斷輸入是否正確
 96         while(wall_paper_id  != str(1) and wall_paper_id  != str(2) and wall_paper_id  != str(3) and wall_paper_id  != str(4)):
 97             wall_paper_id = input("壁紙類型:最新壁紙 1, 最熱壁紙 2, 女生壁紙 3, 星空壁紙 4\n請輸入編號以便選擇5K超清壁紙類型:")
 98 
 99 
100         # 選擇要下載的壁紙數量
101         wall_paper_count = input("請輸入要下載的5K超清壁紙的數量:")
102         # 判斷輸入是否正確
103         while(int(wall_paper_count) <= 0):
104             wall_paper_count = input("請輸入要下載的5K超清壁紙的數量:")
105 
106 
107         # 開始爬取5K高清壁紙
108         print("正在下載5K超清壁紙,請稍等……")
109         crawler_photo(int(wall_paper_id), int(wall_paper_count))
110         print('\n下載5K高清壁紙成功!')

 

初學者對Python的概念模糊不清的,Python能做什麼,學的時候該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,詳情可以複製有道雲筆記鏈接到瀏覽器打開瞭解:http://note.youdao.com/noteshare?id=e4fa02e7b56d7909a27674cdb3da08aa

學習視頻資料、開發工具等都有免費分享,還有專業的老師答疑

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 註意:可變參數類型是在jdk1.5版本的新特性,數組類型是jdk1.0就有了。 這篇文章主要介紹了Java方法的可變參數類型,通過實例對Java中的可變參數類型進行了較為深入的分析,需要的朋友可以參考下。 Java方法中的可變參數類型是一個非常重要的概念,有著非常廣泛的應用。本文就以實例形式對此加以 ...
  • 併發編程之線程第一篇 3.4 原理之線程運行 線程上下文切換(Thread Context Switch) 3.5 常見方法 3.6 start與run 3.7 sleep與yield 案例 - 防止CPU占用100% 3.8 join方法詳解 3.9 interrupt方法詳解 兩階段終止模式 3 ...
  • notepad中運行python cmd /k python "$(FULL_CURRENT_PATH)" & ECHO. & PAUSE & EXIT notepad中運行python kALI 用: sudo apt get install ttf wqy zenhei kali安裝後出現亂碼 ...
  • 在MainModule里 Design 模式 1]RecallLastTheme 設為True 2]Theme選一個皮膚 總共有 classicgraycrispneptunetritontriton.modifiedariagraphite 8個預設皮膚 uses uniStrUtils, pro ...
  • SpringBoot官方不推薦使用jsp,因為jsp不好發揮SpringBoot的特性。官方推薦使用模板引擎代替jsp,現在很多公司都使用FreeMarker來作為SpringBoot的視圖。 SpringBoot對動態頁面的支持很好,為多種模板引擎提供了預設配置,常用的有: Thymeleaf F ...
  • Lamda表達式學習筆記一 一、Lamda語法詮釋 三傻大鬧寶萊塢的主人公蘭徹說的一句話讓我映像深刻:用簡單的語言來表達同樣的意 我並不是說書上的定義怎麼怎麼不對,而是應該理解書本上的定義,並用簡單的話語描述! 那麼正題來了,lamda表達式是什麼? 定義:lamda表達式是一個可傳遞的代碼塊,可以 ...
  • 1.單調隊列簡介: 單調隊列是一種數據結構,類似如單調棧,但裡面的元素必須在一個區間內,如果“過時”就要出隊。所以,單調隊列可以在兩端進行出隊,但只能再隊尾入隊。按此性質,傳統的隊列已無法滿足需求,需要使用雙端隊列,再C++的STL里,雙端隊列定義在deque里: #include <deque> ...
  • 效果圖: 左邊的樹 的樹結點 ,通過 結點名 與 右 側TabSheet名 一致時,顯示 相關頁面。 這是相關 源代碼 procedure TMainForm.UniFormCreate(Sender: TObject); var I: Integer; begin for I := UniPage ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...