前言 那麼今天給大家分享的是關於python爬蟲的一個小案例,爬取的數據是圖片數據,其實咱們互聯網當中包括文本數據、圖片數據、音頻數據、視頻數據。 這些數據只要你在互聯網當中能夠用肉眼看到,都能夠通過我們爬蟲代碼批量的獲取到 cosplay是英文Costume Play的簡寫,日文コスプレ。指利用服 ...
前言
那麼今天給大家分享的是關於python爬蟲的一個小案例,爬取的數據是圖片數據,其實咱們互聯網當中包括文本數據、圖片數據、音頻數據、視頻數據。
這些數據只要你在互聯網當中能夠用肉眼看到,都能夠通過我們爬蟲代碼批量的獲取到
cosplay是英文Costume Play的簡寫,日文コスプレ。指利用服裝、飾品、道具以及化妝來扮演動漫作品、游戲中以及古代人物的角色。
玩cosplay的人則一般被稱為cosper,今天帶大家爬取cosplay小姐姐高清壁紙圖片,老司機的你值得擁有
環境介紹
python 3.6
pycharm
requests
parsel
爬蟲的一般思路
1、分析目標網頁,確定爬取的url路徑,headers參數
2、發送請求 -- requests 模擬瀏覽器發送請求,獲取響應數據
3、解析數據 -- parsel 轉化為Selector對象,Selector對象具有xpath的方法,能夠對轉化的數據進行處理
4、保存數據
步驟
1、導入工具
import requests import parsel
2、確定爬取的url路徑,headers參數
base_url = 'http://www.win4000.com/meinvtag26_1.html' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
3、發送請求 -- requests 模擬瀏覽器發送請求,獲取響應數據
response = requests.get(base_url, headers=headers) data = response.text # print(data)
4、解析數據 -- parsel 轉化為Selector對象,Selector對象具有xpath的方法,能夠對轉化的數據進行處理
html_data = parsel.Selector(data) data_list = html_data.xpath('//div[@class="Left_bar"]//ul/li/a/@href').extract() print(data_list) # 遍歷列表元素 for alist in data_list: # print(alist) # 發送相冊的url地址請求解析相冊內部圖片的url地址 response_2 = requests.get(alist, headers=headers).text # 解析相冊內部圖片的url地址 1 html_2 = parsel.Selector(response_2) img_url = html_2.xpath('//div[@class="pic-meinv"]//img/@data-original').extract_first() # print(img_url) # 請求圖片URL地址的圖片數據 img_data = requests.get(img_url, headers=headers).content
5、保存數據
#準備圖片文件名 file_name = img_url.split('/')[-1] # print(file_name) # 保存數據 with open('img\\' + file_name, 'wb') as f: print('正在保存圖片:', file_name) f.write(img_data)
最後運行代碼,效果如下圖
歡迎點擊右上角關註小編,除了分享技術文章之外還有很多福利,私信學習資料可以領取包括不限於Python實戰演練、PDF電子文檔、面試集錦、學習資料等。