看我如何用定值 Cookie 實現反爬

来源:https://www.cnblogs.com/huaweiyun/archive/2023/04/03/17282623.html
-Advertisement-
Play Games

摘要:本次案例,用定值Cookie實現反爬。 本文分享自華為雲社區《我是怎麼用一個特殊Cookie,限制住別人的爬蟲的》,作者: 夢想橡皮擦 。 Cookie 生成 由於本案例需要用到一個特定的 Cookie ,所以我們需要提前將其生成,你可以直接設置一個固定的字元串,也可以使用 Python 加密 ...


摘要:本次案例,用定值Cookie實現反爬。

本文分享自華為雲社區《我是怎麼用一個特殊Cookie,限制住別人的爬蟲的》,作者: 夢想橡皮擦 。

Cookie 生成

由於本案例需要用到一個特定的 Cookie ,所以我們需要提前將其生成,你可以直接設置一個固定的字元串,也可以使用 Python 加密模塊來加密一段文本,例如本案例加密 夢想橡皮擦。

下麵是一個示例代碼,展示瞭如何使用 Python 的 hashlib 模塊進行加密:

import hashlib
# 要加密的文本
text = "夢想橡皮擦"
# 使用 sha256 演算法進行加密
encrypted_text = hashlib.sha256(text.encode()).hexdigest()
print(encrypted_text)

在這個例子中,我們使用了 hashlib 模塊中的 sha256 演算法對文本進行加密。這個演算法生成了一個長度為 64 位的十六進位哈希值,用於表示加密後的文本。

註意,這個演算法只能用於加密文本,而不能用於解密。因此,一旦文本被加密,就無法恢覆成原來的文本,即不可逆加密/單項加密。

Python Flask 框架生成 Cookie

在 Python 的 Flask 框架中,可以使用 make_response 函數和 set_cookie 方法來生成一個 Cookie。

例如,下麵的代碼片段展示瞭如何在 Flask 中設置一個名為 story 的 Cookie,並將它的值設為前文建立的加密串。

from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Setting a cookie')
 encrypted_text = hashlib.sha256(text.encode()).hexdigest()
 resp.set_cookie('story', encrypted_text)
 return resp

在這個例子中,我們使用 make_response() 函數創建了一個響應對象,然後使用 set_cookie() 方法來設置 cookie。最後,我們將響應對象返回給客戶端。

註意,上面的代碼僅創建了一個簡單的 Cookie,它只有名稱和值兩個部分。你還可以使用其他可選參數來設置 Cookie 的其他屬性,例如過期時間、功能變數名稱等。

接下來為大家在補充一下 make_response() 相關知識。

Flask make_response 載入模板

在 Flask 中,你可以使用 make_response() 函數和模板系統來生成帶有模板的響應。

下麵是一個示例代碼,展示瞭如何使用 make_response() 函數載入模板:

from flask import Flask, make_response, render_template
app = Flask(__name__)
@app.route('/')
def index():
 # 載入模板並渲染
 rendered_template = render_template('index.html', title='夢想橡皮擦')
 # 使用 make_response 函數創建響應
    resp = make_response(rendered_template)
 return resp

在這個例子中,我們首先使用 Flask 的 render_template() 函數載入並渲染了名為 index.html 的模板。然後我們使用 make_response() 函數創建了一個響應對象,並將渲染後的模板作為響應的內容。最後,我們返回了這個響應對象給客戶端。

註意,你需要在 Flask 應用的模板目錄中存在名為 index.html 的模板文件,才能正常使用上述代碼。

然後我們將該視圖函數補充完整,代碼在 app/routes.py 文件中。

@app.route('/')
@app.route('/index')
def index():
    item = {
 "msg": "後臺傳遞信息"
 }
 # 訪問首頁生成一個 Cookie 值,該值用於訪問特定頁面
 rendered_template = render_template('index.html', title='夢想橡皮擦')
    resp = make_response(rendered_template)
    text = "夢想橡皮擦"
 # 使用 sha256 演算法進行加密
 encrypted_text = hashlib.sha256(text.encode()).hexdigest()
 resp.set_cookie('story', encrypted_text)
 return resp

此時當我們訪問爬蟲訓練場首頁的時候,就會在 Cookie 中寫入一個加密之後的字元串。

通過開發者工具,可以查看到響應頭。

最後一步,就是在 Python Flask 框架中判斷剛剛的 Cookie 值,如果存在則響應數據,否則返回 403。

Flask 判斷指定 cookie 是否存在

在 Python 的 Flask 框架中,你可以使用 request.cookies 屬性來判斷指定的 Cookie 是否存在。

例如,下麵的代碼片段展示瞭如何判斷一個名為 story 的 Cookie 是否存在:

from flask import Flask, request
app = Flask(__name__)
@app.route('/')
def index():
 if 'story' in request.cookies:
 # 如果存在 'story' cookie,則執行相應操作
 # ...
 else:
 # 如果不存在 'story' cookie,則執行相應操作
 # ...

將代碼補充完整,文件是 app/antispider/index.py。

@antispider.route('/cookie_demo')
def cookie_demo():
 if 'story' in request.cookies:
 # 如果存在 'story' cookie,則執行相應操作
 # ...
 return render_template("antispider/cookie_demo.html")
 else:
 return "沒有許可權", 403

補充知識點

在 Python 的 Flask 框架中,除了使用 set_cookie() 方法設置 cookie 以外,還有其他幾種操作 cookie 的方法。

下麵是一些常用的操作 cookie 的方法:

  • 設置 cookie 的值:你可以使用 set_cookie() 方法來設置 cookie 的值。例如:
from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Setting a cookie')
 resp.set_cookie('user', 'xiangpica')
 return resp
  • 獲取 cookie 的值:你可以使用 request.cookies字典來獲取 cookie 的值。例如:
from flask import Flask, request
app = Flask(__name__)
@app.route('/')
def index():
    user = request.cookies.get('user')
 return user
  • 刪除 cookie:你可以使用 set_cookie() 方法並將 cookie 的過期時間設為過去的時間來刪除 cookie。例如:
from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Deleting a cookie')
 resp.set_cookie('user', '', expires=0)
 return resp

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本章將探索驅動程式開發的基礎部分,瞭解驅動對象`DRIVER_OBJECT`結構體的定義,一般來說驅動程式`DriverEntry`入口處都會存在這樣一個驅動對象,該對象內所包含的就是當前所載入驅動自身的一些詳細參數,例如驅動大小,驅動標誌,驅動名,驅動節等等,每一個驅動程式都會存在這樣的一個結構,... ...
  • NodeManager(NM)中的狀態機分為三類:Application、Container 和 LocalizedResource,它們均直接或者間接參與維護一個應用程式的生命周期。 ...
  • 微信小程式訂閱消息開髮指南(java) 第一步 準備階段 1、你得有一個小程式,並且認證了,個人的也行 2、開通訂閱消息 小程式後臺->功能->訂閱消息 3、公共模板庫選擇一個模板 選擇的時候,選擇你需要的欄位,因為欄位有限制 4、我的模板點擊詳情 詳情內容,模板 id 都是需要提供個服務端開發人員 ...
  • 在堆裡面存放著 Java 世界中幾乎所有的對象實例,垃圾收集器在對 Java 堆進行回收前,第一件事情就是要確定這些對象之中哪些還“存活”著,哪些已經“死去”(“死去”即不可能再被任何途徑使用的對象)。 有兩種判斷對象是否存活的演算法:引用計數演算法、可達性分析演算法。 ...
  • 問題描述 通常我們在rust項目中引入第三方依賴包時,會直接指定包的版本,這種方式指定後,Cargo在編譯時會從crates.io這個源中下載這些依賴包。 [package] name = "foo" version = "0.1.0" edition = "2021" [dependencies] ...
  • 1、定義一個介面用來控制限制的時間 package org.jeecg.common.aspect.annotation; import java.lang.annotation.Documented; import java.lang.annotation.ElementType; import ...
  • #spring事務理解 前提兩個都是事務的方法,並且兩個方法會進行調用,調用方統一使用required 舉例有兩個方法: required 如果當前上下文存在事務,被調用方則加入該調用方的事務,沒有的話就新建(指單獨被調用時)一個事務 2. supports 支持事務,上下文中有事務,被調用方則加入 ...
  • 1、pom.xml 文件導入插入包 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchem ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...