python爬蟲爬取網站音樂肯定會遇到的坑

-Advertisement-

前言大家都很喜歡聽歌吧，沒有人不喜歡聽歌。心情好的時候要聽歌，心情不好的時候也要聽歌，反正歌是大家都喜歡聽的。最近我想在網站上下載幾首音樂放到我的u盤裡聽，但是上網上一找，各大音樂網站下載歌曲（尤其是好聽的歌曲）都需要vip。對於像我這樣的窮人來說，肯定是不會花幾十塊錢去下載幾首音樂啦，而且作 ...

前言

大家都很喜歡聽歌吧，沒有人不喜歡聽歌。心情好的時候要聽歌，心情不好的時候也要聽歌，反正歌是大家都喜歡聽的。

最近我想在網站上下載幾首音樂放到我的u盤裡聽，但是上網上一找，各大音樂網站下載歌曲（尤其是好聽的歌曲）都需要vip。

對於像我這樣的窮人來說，肯定是不會花幾十塊錢去下載幾首音樂啦，而且作為程式員，充錢去下載音樂那也是不可能的，於是

我花了一天時間，上網找了各種資料來學習一下怎樣才能不花錢白嫖到網站上的音樂。

當然，方法還是有很多種的，最後我還是選擇了一種最簡單，最方便的一種方法： python爬蟲。下麵，我就跟大家分享一下我在

用python爬蟲時遇到的坑。

下麵，我以爬取某易雲音樂為例，介紹一下我時如何學習python爬蟲的：

思路:

•音樂從哪裡來？—網站的伺服器里

•怎麼從網址里得到音樂？—向網站發起網路請求

•刪選音樂文件

•下載音樂文件

具體實現

引入發送網路請求的第三方庫

import requests # 發送網路請求的第三方庫
複製代碼

安裝方法

pip install requests

2 引入數據解析第三方庫

from lxml import etree # 數據解析第三方庫
複製代碼

安裝方法

pip install lxml

3 某易雲音樂網站列表url為’https://music.163.com/#/discover/toplist?id=3778678’

url = 'https://music.163.com/#/discover/toplist?id=3778678'
複製代碼

4 發送請求獲取頁面數據

response = requests.get(url=url) # 請求頁面數據
複製代碼

5 解析數據

html=etree.HTML(response.text) # 解析頁面數據
複製代碼

6 獲取所有歌曲標簽集合（ a標簽）

id_list = html.xpath('//a[contains(@href,"song?")]')  # 所有歌曲id集合
複製代碼

7 下載歌曲

Python學習交流Q群：906715085###
base_url = 'http://music.163.com/song/media/outer/url?id=' # 下載音樂網址首碼
# 下載音樂url = 網址首碼 + 音樂id
for data in id_list:
    href = data.xpath('./@href')[0]
    music_id = href.split('=')[1] # 音樂id
    music_url = base_url + music_id # 下載音樂url
    music_name = data.xpath('./text()')[0] # 下載音樂名稱
    music = requests.get(url = music_url)
    # 將下載的音樂以文件形式保存下來
    with open('./music/%s.mp3' % music_name, 'wb') as file:
         file.write(music.content)
         print('<%s>下載成功' % music_name)
複製代碼

遇到的坑

以上的方法我是從一個視頻里學到的，那個視頻是半年前出的，可能當時這種方法還好使，但是今天我在用這種方法下載音樂文

件的時候突然就報錯了。

首先，編輯器報錯找不到 music_name 和 music_id ,我仔細一看，獲取的id_list集合里（也就是標簽集合里）的id根本不是id，是

代碼，估計在這裡音樂網站也做了相應的反扒機制。

其次，我自己在網站里找到了一首音樂獲取了它的id並把id賦值給music_id，結果當用外鏈下載音樂時報錯460，顯示網路擁擠，

估計下載音樂的網址也不好使了。

base_url = 'http://music.163.com/song/media/outer/url?id='
music_id = '1804320463.mp3'
music_url = base_url + music_id
music = requests.get(url=music_url)
print(music.text)
複製代碼

{"msg":"網路太擁擠，請稍候再試！","code":-460,"message":"網路太擁擠，請稍候再試！"}e

最後，我列印出music_url,點擊進去，還是可以聽歌和下載的，不知道這是為什麼了

base_url = 'http://music.163.com/song/media/outer/url?id='
music_id = '1804320463.mp3'
music_url = base_url + music_id
# music = requests.get(url=music_url)
print(music_url)
複製代碼

music.163.com/song/media/…

最後

希望以後在爬取音樂的時候都不會在遇到。今天的分享到這裡就結束了，下一章再見。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

設計原則之KISS，YAGNI原則

KISS原則 kiss原則的英文描述有好幾個版本，比如下麵這幾個。 Keep It Simple and Stupid. Keep It Short and Simple. Keep It Simple and Straightforward. 它們意思都差不多，翻譯成中文就是儘量保持簡單。我們知道 ...
PowerDotNet平臺化軟體架構設計與實現系列（13）：應用監控平臺

本文再寫一篇和具體業務邏輯幾乎無關的公共服務應用監控平臺。PowerDotNet自研的應用監控平臺系統，是服務治理的重要拼圖，和服務治理平臺配合使用效果更好。監控開源產品非常豐富，站在巨人的肩膀上，PowerDotNet自研的監控平臺，除了基本的監控功能，還可以通過加一層代理，將應用接入開源監控軟 ...
設計模式詳解之結構型設計模式——適配器、裝飾器

解釋器模式是什麼解釋器是一種行為型設計模式，指給分析對象定義一個語言，並定義該語言的文法表示，再設計一個解析器來解釋語言中的句子。也就是說，用編譯語言的方式來分析應用中的實例。這種模式實現了文法表達式處理的介面，該介面解釋一個特定的上下文。為什麼用解釋器模式在軟體開發中，會遇到有些問題多次重覆 ...
解決idea中每次創建項目都要重覆配置maven，來看全網僅需幾步全局配置

幫助你在一天之內通過這篇文章快速學習SpringBoot框架以及各種開發必備的工具與插件！！！ ...
Java面試題資料合集

Java面試題資料合集 2021年最新版--Java+最常見的+200++面試題彙總+答案總結彙總.pdf BIO,NIO,AIO,Netty面試題 35道.pdf Dubbo面試題 47道.pdf ElasticSearch面試題 30道.pdf Git常用命令面試題 60道.pdf Java基礎 ...
惰性初始化

public class SprinklerSystem { private String value1, value2, value3; private WaterSource source = new WaterSource(); private int i; private float f; ...
Spring 源碼（6）BeanFactoryPostProcessor怎麼執行的？

上一篇文章 https://www.cnblogs.com/redwinter/p/16167214.html 解讀瞭如何進行自定義屬性值的編輯器的解析器，並且還介紹了BeanFactory的準備過程中做了哪些事情。這篇文章繼續介紹AbstractApplicationContext#refresh ...
Mysql 計算地址經緯度距離實時位置

前言最近在做項目時候，遇到一個這樣子的需求，點到卡包裡面卡券使用使用，需要展示卡券使用附近門店，思路資料庫地址表設計通用的區域街道地址表tz_sys_area 欄位名稱類型備註 area_id bigint 區域ID area_name varchar(32) 區功能變數名稱稱 parent_ ...

python爬蟲爬取網站音樂肯定會遇到的坑

前言

思路:

具體實現

安裝方法

安裝方法

4 發送請求獲取頁面數據

5 解析數據

6 獲取所有歌曲標簽集合（ a標簽 ）

7 下載歌曲

遇到的坑

6 獲取所有歌曲標簽集合（ a標簽）