彈幕全是“二刷”,這部劇有多好看?Python爬取騰訊視頻1.1W彈幕,做詞雲分析

来源:https://www.cnblogs.com/qshhl/archive/2022/03/29/16074292.html
-Advertisement-
Play Games

《獵罪圖鑒》可以說是國產懸疑劇之光了,上線首周熱度不斷飆升。該劇講述了因一起塵封舊案而結怨的模擬畫像師沈翊和刑警隊長杜城,在機緣巧合下被迫搭檔,兩人聯手偵破多起離奇疑案,共同追蹤謎底真相的故事。今天就用Python爬取該劇彈幕,做詞雲圖 環境介紹 python 3.8pycharmrequests ...


《獵罪圖鑒》可以說是國產懸疑劇之光了,上線首周熱度不斷飆升。
該劇講述了因一起塵封舊案而結怨的模擬畫像師沈翊和刑警隊長杜城,在機緣巧合下被迫搭檔,兩人聯手偵破多起離奇疑案,共同追蹤謎底真相的故事。
今天就用Python爬取該劇彈幕,做詞雲圖

環境介紹

python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts

對於本篇文章有疑問的同學可以加【資料白嫖、解答交流群:910981974】

視頻彈幕收集

請求數據

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'
}
for page in range(15, 1500, 30):
    url = f'https://mfm.XXXX.com/danmu?otype=json&target_id=7712618480%26vid%3Dg00423lkmas&session_key=0%2C0%2C0&timestamp={page}&_=1647931110703'

    response = requests.get(url=url, headers=headers)

獲取數據 從一個字元串 變成了一個 字典 (容器)

json_data = response.json()

解析數據

for comment in json_data['comments']:
    commentid = comment['commentid']
    opername = comment['opername']
    content = comment['content']

保存數據

with open('彈幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow([commentid, opername, content])

運行代碼,得到1W多條彈幕數據

詞雲可視化

導入數據

wordlist = []
data = pd.read_csv('彈幕.csv')['content']
data

詞雲圖

a = [list(z) for z in zip(word, count)]
c = (
    WordCloud()
    .add('', a, word_size_range=[10, 50], shape='circle')
    .set_global_opts(title_opts=opts.TitleOpts(title="詞雲圖"))
)
c.render_notebook()


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 隨著ECMAScript 6.0(ES6)是JavaScript 語言的下一代標準的普及,各個大公司和大的廠商都推出了自己的前端開發框架,如Angular,React,Vue 等,微軟更是錦上添花,開發出Typescript 的JavaScript超集語言,更是讓各個前端框架所採用,這將是前端領域的 ...
  • 最近有個項目要在瀏覽器端裁剪並上傳圖片。由於缺乏人力,只能我上陣殺敵。通過參考各種文章,最後決定用croopperjs進行圖片裁剪,用webuploader上傳文件。本文涉及到的知識至少有Java基礎、SpringMVC、thymeleaf模版引擎、JS基礎、JQuery基礎、Bootstrap組件... ...
  • 第一步: npm install weixin-js-sdk -S // (或者直接index.html裡面引入js文件 http://res.wx.qq.com/open/js/jweixin-1.6.0.js 官方文檔:https://developers.weixin.qq.com/doc/o ...
  • 開發ASP.NET Core 程式,並Build成Docker鏡像發佈到Docker 註冊表中是十分輕鬆的事情,只需在VS 的發佈中選擇 其他Docker容器註冊表, 填寫必要信息,就可以把代碼發佈到企業自己的Docker 容器註冊表中了。請參考下圖所示。這個操作也可以發佈到 第三方的Docker ...
  • 訪問者模式屬於行為型模式;指將作用於某種數據結構中各元素的操作分離出來封裝成獨立的類,使其在不改變數據結構的前提下可以添加作用於這些元素的新的操作,為數據結構中的每個元素提供多種訪問方式。它將對數據的操作與數據結構進行分離,是行為類模式中最複雜的一種模式。 訪問者模式的目的是封裝一些施加於某種數據結 ...
  • Profile是個好東西。通過Profile,我們可以非常方便地條件化Bean的創建,動態調整應用程式的功能。可是,Profile只能做些簡單的條件化,對於複雜一點的條件化Profile是無法勝任的。比如現有這樣的數據源創建需求: 1.如果類路徑存在DBCP的JAR包,則創建DBCP提供的Basic ...
  • 實戰項目地址newbeemall,集成RediSearch,代碼開源已上傳,支持的話可以點個star😁 RediSearch 是基於 Redis 開發的支持二級索引、查詢引擎和全文搜索的應用程式。在2.0的版本中,簡單看下官網測試報告: 索引構建 在索引構建測試中,RediSearch 用221秒 ...
  • 思路: * A:創建一個HashMap集合 * B:創建一個ArrayList集合 * C:創建花色數組和點數數組 * D:從0開始往HashMap裡面存儲編號,並存儲對應的牌 * 同時往ArrayList裡面存儲編號即可。 * E:洗牌(洗的是編號) * F:發牌(發的也是編號,為了保證編號是排序 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...