現在人們哪怕是買個牙刷可能都會在淘寶上面,而且在買東西的時候每個人都會做的一件事情就是看評論,看看之前買家評論瞭解商品質量,外觀是不是和圖片一樣等等。但是如果真的想要一條一條去看的話,那時間是真的要很多,當然瞭如果買的小物件那倒無所謂,如果是比較貴重的物品就必須得好好看了(PS:在小編心裡100以上 ...
現在人們哪怕是買個牙刷可能都會在淘寶上面,而且在買東西的時候每個人都會做的一件事情就是看評論,看看之前買家評論瞭解商品質量,外觀是不是和圖片一樣等等。但是如果真的想要一條一條去看的話,那時間是真的要很多,當然瞭如果買的小物件那倒無所謂,如果是比較貴重的物品就必須得好好看了(PS:在小編心裡100以上就是貴重物品,哈哈哈哈)
如果是一般人為了讓自己買的東西放心當然是選擇一條一條看,或者直接去實體店買。但是身為技(chui)術(niu)人(zhuang)員(bi)的小編,肯定是用Python批量爬取淘寶商品信息併進行簡單的數據分析啦~~~~
想要爬取評論第一件事就是找到真實的URL地址,具體步驟:
- F12(開發者選項)
- Notework
- F5(刷新)
- feedRateList(文件名)
- Headers
- 複製Request URL
然後去除不必要的欄位,獲取自己想要的內容
看看運行後的效果圖
如果你想要進行簡單數據分析的話,那可以把爬取下來的評論保存下來。
然後用Python對其進行數據分析,對於數據可視化小編比較推薦pyecharts
它可以是這樣的
也可以是這樣的