用 Python 獲取 B 站播放歷史記錄

来源:https://www.cnblogs.com/qingdeng123/archive/2019/04/10/10686155.html
-Advertisement-
Play Games

用 Python 獲取 B 站播放歷史記錄 最近 B 站出了一個年度報告,統計用戶一年當中在 B 站上觀看視頻的總時長和總個數。過去一年我居然在 B 站上看了2600+個視頻,總計251個小時,居然花了這麼多時間,嚇得我差點把 Bilibili App 卸載了... 然而我又很好奇,到底我在 B 站 ...


用 Python 獲取 B 站播放歷史記錄

最近 B 站出了一個年度報告,統計用戶一年當中在 B 站上觀看視頻的總時長和總個數。過去一年我居然在 B 站上看了2600+個視頻,總計251個小時,居然花了這麼多時間,嚇得我差點把 Bilibili App 卸載了...

 

 

 

然而我又很好奇,到底我在 B 站上都看了些什麼類型小姐姐的視頻,用幾行 Python 代碼實現了一下。

獲取請求 Api 介面與 Cookie

實現起來非常容易,獲取 cookie 模擬請求即可

  1. 使用 chrome 瀏覽器
  2. 登陸B 站,進入歷史記錄
  3. 在網頁任意位置,滑鼠右鍵檢查

 

 

 

  1. 按照下圖所示,進入Network頁面,篩選框輸入history,對結果進行篩選,頁面滾輪往下即可看到瀏覽過程中的歷史記錄請求的Header

 

 

 

  1. 將 Header 下, cookie 一行的字元串複製出來到一個cookie.txt文本里

 

 

 

Python 代碼實現

  • 偽造瀏覽器請求
import json
import requests

def read_cookies_file(filename):
    """read cookie txt file
    :param filename: (str) cookies file path
    :return: (dict) cookies
    """
    with open(filename, 'r') as fp:
        cookies = fp.read()
        return cookies

def get_header(filename):
    cookie = read_cookies_file(filename)
    headers = {
        'Accept': '*/*',
        'Accept-Encoding': 'gzip, deflate, br',
        'Accept-Language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
        'Connection': 'keep-alive',
        'Cookie': cookie,
        'Host': 'api.bilibili.com',
        'Referer': 'https://www.bilibili.com/account/history',
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
    }
    return headers

def req_get(headers, url):
    resp = requests.get(url, headers=headers)
    return json.loads(resp.text)
  • 使用 cookie 模擬請求
def get_all_bili_history(cookie_file):
    headers = bilibili.get_header(cookie_file)
    history = {'all': []}
    for page_num in range(MAX_PAGE):
        time.sleep(0.6)
        url = 'https://api.bilibili.com/x/v2/history?pn={pn}&ps={ps}&jsonp=jsonp'.format(pn=page_num, ps=PAGE_PER_NUM)
        result = bilibili.req_get(headers, url)
        print('page = {} code = {} datalen = {}'.format(page_num, result['code'], len(result['data'])))
        if len(result['data']) == 0:
            break
        history['all'].append(result)

    return history
  • 代碼非常簡單,完整代碼加群973783996

存在的問題

  • 本來想拿到所有的播放記錄,做一些統計和預測,但是經過實測,B 站只能獲取到最近1000條或者最近3個月的播放記錄
  • 如果想獲得更多,只能做一個監測程式,不停地從介面獲取數據

安全問題

儘量不要使用不安全的 wifi 網路,有可能會被別有用心之人獲取網路請求的 Package,易泄露個人隱私。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.前言 匿名內部類在我們JAVA程式員的日常工作中經常要用到,但是很多時候也只是照本宣科地用,雖然也在用,但往往忽略了以下幾點:為什麼能這麼用?匿名內部類的語法是怎樣的?有哪些限制?因此,最近,我在完成了手頭的開發任務後,查閱了一下JAVA官方文檔,將匿名內部類的使用進行了一下總結,案例也摘自官方 ...
  • 註解屬於比較高級的Java開發技術,前面介紹的內置註解專用於編譯器檢查代碼,另外一些註解則由各大框架定義與調用,像Web開發常見的Spring框架、Mybatis框架,Android開發常見的ButterKnife框架等等,都使用了大量的註解。為了更好地弄清註解的應用原理,接下來不妨嘗試自定義註解, ...
  • PIL庫學習及運用 1.庫的介紹Python Imaging Library,簡稱PIL python圖像處理庫,這個庫支持多種文件格式,並提供了強大的圖像處理和圖形處理能力。 下麵是我的學習筆記 首先,先安裝PIL庫,直接打開cmd,輸入pip install pillow,回車即可 這裡先展示一 ...
  • 1.創建項目 組織Django代碼最簡單的方式是使用Django的“項目”(project):一個包含了組成單個網站的所有文件的目錄。Django提供了一個叫django admin.py的命令來幫助創建這樣項目的目錄。 Windows下: 運行之後,我們用資源管理器,可以發現新建了一個mysite ...
  • 配置環境:python 3.6 python編輯器:pycharm 代碼如下: ...
  • docxtpl 按指定的word模板填充內容 安裝 示例 模板文件 目標文件 符《匆匆》朱自清 燕子去了,有再來的時候;楊柳枯了,有再青的時候;桃花謝了,有再開的時候。但是,聰明的,你告訴我,我們的日子為什麼一去不復返呢?——是有人偷了他們罷:那是誰?又藏在何處呢?是他們自己逃走了罷:現在又到了哪裡 ...
  • Python全棧day 02 一、迴圈語句 while 用法 python num = 1 while num not and or 四、編碼補充 gbk碼、gb2312碼:都是亞洲地區使用的編碼,都用2個位元組表示一個漢字。 GBK: 漢字國標擴展碼,基本上採用了原來GB2312 80所有的漢字及碼 ...
  • 接上一篇:《Java8新特性之stream》,下麵繼續接著講Stream 5、流的中間操作 常見的流的中間操作,歸為以下三大類:篩選和切片流操作、元素映射操作、元素排序操作: 5.1、篩選和切片 例如以訂單數據為例,在做報表展示時,會根據訂單狀態、用戶信息、支付結果等狀態來分別展示(即過濾和統計展示 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...