前言 使用Python爬取任意網頁的資源文件,比如圖片、音頻、視頻;一般常用的做法就是把網頁的HTML請求下來通過XPath或者正則來獲取自己想要的資源,這裡我做了一個爬蟲工具軟體,可以一鍵爬取資源 媒體文件;但是需要說明的是,這裡爬取資源文件只針對HTML已有的文件,如果需要二次請求的是爬取不到的 ...
前言
使用Python爬取任意網頁的資源文件,比如圖片、音頻、視頻;一般常用的做法就是把網頁的HTML請求下來通過XPath或者正則來獲取自己想要的資源,這裡我做了一個爬蟲工具軟體,可以一鍵爬取資源 媒體文件;但是需要說明的是,這裡爬取資源文件只針對HTML已有的文件,如果需要二次請求的是爬取不到的,比如酷狗音樂播放界面,因為要做通用工具,匹配不同的網站!!!