第一步:頁面分析 我們要抓取的商品頁面: 這裡我們用正則表達式匹配出該段信息。進一步可以發現它是一個json數據,用json.loads()解析。解析後我們可以藉助線上工具可以查看數據的層級結構,找到需要數據的key。這裡我們把頁面分析與數據提取放到一塊來講了,代碼邏輯: 第三步:開始抓取 第四步: ...
第一步:頁面分析
我們要抓取的商品頁面:
這裡我們用正則表達式匹配出該段信息。進一步可以發現它是一個json數據,用json.loads()解析。解析後我們可以藉助線上工具可以查看數據的層級結構,找到需要數據的key。這裡我們把頁面分析與數據提取放到一塊來講了,代碼邏輯:
第三步:開始抓取
第四步:數據分析
我們提取了商品的店名、省份、銷量(月)、單價、款式、對應鏈接,共6個欄位。下麵是初步分析結果
賣家還是主要集中在廣州、杭州、上海等東部沿海地帶
這些關鍵詞的背後當然是“買買買”了 :D
大部分商家的月銷量在50~300之間,1000件以上的銷量的商家不到3%
價格整體不高,物美價廉,深受女生同胞喜愛,買買買....
get到了嘛。有優惠有好看!
進群:125240963 即可獲取數十套PDF!