前言 今天給大家介紹的是Python爬蟲豆瓣Top250電影短評數據保存本地,在這裡給需要的小伙伴們幫助,並且給出一點小心得。 開發工具 **Python版本:**3.6 相關模塊: requests模塊 parsel模塊 time模塊 環境搭建 安裝Python並添加到環境變數,pip安裝需要的相 ...
前言
今天給大家介紹的是Python爬蟲豆瓣Top250電影短評數據保存本地,在這裡給需要的小伙伴們幫助,並且給出一點小心得。
開發工具
Python版本:3.6
相關模塊:
requests模塊
parsel模塊
time模塊
環境搭建
安裝Python並添加到環境變數,pip安裝需要的相關模塊即可。
文中完整代碼及文件,評論留言獲取
數據來源查詢分析
瀏覽器中打開我們要爬取的頁面
按F12進入開發者工具,查看我們想要的電影短評在哪裡
這裡我們需要頁面數據就可以了
代碼實現
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}
for page in range(1, 20):
url = f'https://movie.douban.com/subject/35613853/comments?start={page*20}&limit=20&status=P&sort=new_score'
data_html = requests.get(url=url, headers=headers).text
selector = parsel.Selector(data_html)
comment_list = selector.css('.comment-item')
for comment in comment_list:
short = comment.css('.short::text').get().strip()
name = comment.css('.comment-info a::text').get().strip()
time = comment.css('.comment-time::text').get().strip()
vote_count = comment.css('.votes.vote-count::text').get().strip()
print(short, name, time, vote_count)
最後
今天的分享到這裡就結束了 ,感興趣的朋友也可以去試試哈
對文章有問題的,或者有其他關於python的問題,可以在評論區留言或者私信我哦
覺得我分享的文章不錯的話,可以關註一下我,或者給文章點贊(/≧▽≦)/