python - bilibili(四)抓包數據亂碼

来源:http://www.cnblogs.com/keinlee/archive/2017/07/08/7132835.html
-Advertisement-
Play Games

上一篇文章中不知道大家發現端倪木有,兩張照片對比很明顯發現第一張是信息很明顯的,第二張是亂碼的。 為什麼會出現這種情況?細心的童鞋可能發現是我們發送給伺服器的請求連接的數據不同: 第一張圖的信息是{"roomid":98284,"uid":271298361556770} 第二張圖的信息是{"uid ...


上一篇文章中不知道大家發現端倪木有,兩張照片對比很明顯發現第一張是信息很明顯的,第二張是亂碼的。

為什麼會出現這種情況?細心的童鞋可能發現是我們發送給伺服器的請求連接的數據不同:

第一張圖的信息是{"roomid":98284,"uid":271298361556770}

第二張圖的信息是{"uid":276194535568357,"protover":2,"roomid":98284}

roomid是真實的房間號,uid是隨機生成的一串數字,可以直接複製登錄。

相比而言,第二張多了個"protover":2參數。其實第一張圖是抓取手機客戶端的數據包,第二張圖是抓取電腦網頁數據包。所以有沒有這個"protover":2這個參數都是可以連接到彈幕伺服器的。

所以我們可以推斷抓包的最容易抓的數據是手機端,其次是wap端,最後才是電腦端。

但是好多時候我們抓包數據的都是如圖二所示的一串串亂碼,不管你用utf8還是用gbk編碼都達不到圖一的那種效果。

這種數據其實是一種壓縮數據gzip,目前wireshark還不支持這種壓縮數據的解壓模式。

現在網站在傳輸中基本上都是用壓縮模式進行傳輸的,所以你抓取到的數據是壓縮後的數據,在你看來就是徹徹底底的亂碼,無從下手。

如圖所示,訪問我的博客首頁http://www.cnblogs.com/keinlee/,抓取伺服器傳送回來的網頁數據是gzip模式,而我們平時訪問的網頁是經過瀏覽器解壓數據並渲染然後呈現給我們。

既然分析嗶哩嗶哩伺服器傳送的是gzip數據,那麼解決辦法就很簡單了,安裝第三方zlib包或者gzip包都可以解決這個問題。

 

系列上一章:python - bilibili(三)wireshark分析


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [user@localhost ~]$ curl -h Usage: curl [options...] Options: (H) means HTTP/HTTPS only, (F) means FTP only --anyauth Pick "any" authentication method... ...
  • 重點講解了多文件上傳,大文件上傳,分塊上傳,斷點續傳,文件秒傳,上傳失敗自動修複再上傳等功能,上傳3、5個G,那都不是事。特別是大文件秒傳功能,不僅節省了上傳時間,還節省了網路帶寬和伺服器空間。 ...
  • 準備工作 VS Code下載地址:https://vscode.cdn.azure.cn/stable/379d2efb5539b09112c793d3d9a413017d736f89/VSCodeSetup-ia32-1.13.1.exe .NET Core 2.0 Preview下載地址:htt ...
  • 在建立好一個WebService後會有一個自帶的 現在可以試一下錄入記錄 在MVC項目中的控制器中調用 然後可以寫簡單的文件上傳下載 在在MVC項目中的控制器中調用 寫得不好,可能有錯請諒解,有錯請指出 ...
  • 筆者最近在和同事共同開發項目時,需要從他們提供的包含資料庫實體類型的類庫中讀取實體信息綁定到自己的項目中(但是都在同一個解決方案里),所以很直接的一種方式就是把項目中所有的實體都以 的形式加入到自己的 Context 中,但是這顯然十分麻煩,而且如果又新增或減少了實體,每次又得在Context中做修 ...
  • 今天開始,我就來說說asp.net core的新特性,今天就說說TagHelper標簽助手。雖然學習.net,最有幫助的就是microsoft的官方說明文檔了,裡面把一些使用說明都寫的非常清楚,但奈何.net core放入文檔微軟還沒來得及翻譯,對於英文不好的人來說簡直就是看的艱辛。所以今天就來學習 ...
  • 我們按照文件目錄的結構來為每個類寫入命名空間,當在一個類中需要實例化另外一個類時,IDE會幫我們寫入use namespace; 。這樣,我們在寫自動載入的時候,就不用考慮將要載入的類在哪一個文件目錄下了,只需要這樣寫: spl_autoload_register(function ($clas... ...
  • 數據結構:是指通過某種方式組織在一起的數據元素的集合 主要包括: 序列:主要介紹列表、元組、字元串 映射:字典 集合(set) 接下來,會對列表進行介紹 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...