Python：requests：詳解超時和重試

-Advertisement-

超時網路請求不可避免會遇上請求超時的情況，在 requests 中，如果不設置你的程式可能會永遠失去響應。超時又可分為連接超時和讀取超時。連接超時連接超時指的是在你的客戶端實現到遠端機器埠的連接時（對應的是connect()），Request 等待的秒數。 import timeimport ...

網路請求不可避免會遇上請求超時的情況，在 requests 中，如果不設置你的程式可能會永遠失去響應。
超時又可分為連接超時和讀取超時。

連接超時

連接超時指的是在你的客戶端實現到遠端機器埠的連接時（對應的是connect()），Request 等待的秒數。

import time
import requests

url = 'http://www.google.com.hk'

print(time.strftime('%Y-%m-%d %H:%M:%S'))
try:
    html = requests.get(url, timeout=5).text
    print('success')
except requests.exceptions.RequestException as e:
    print(e)

print(time.strftime('%Y-%m-%d %H:%M:%S'))

因為 google 被牆了，所以無法連接，錯誤信息顯示 connect timeout（連接超時）。

2018-12-14 14:38:20
HTTPConnectionPool(host='www.google.com.hk', port=80): Max retries exceeded with url: / (Caused by ConnectTimeoutError(<urllib3.connection.HTTPConnection object at 0x00000000047F80F0>, 'Connection to www.google.com.hk timed out. (connect timeout=5)'))
2018-12-14 14:38:25

就算不設置，也會有一個預設的連接超時時間（我測試了下，大概是21秒）。

讀取超時

讀取超時指的就是客戶端等待伺服器發送請求的時間。（特定地，它指的是客戶端要等待伺服器發送位元組之間的時間。在 99.9% 的情況下這指的是伺服器發送第一個位元組之前的時間）。

簡單的說，連接超時就是發起請求連接到連接建立之間的最大時長，讀取超時就是連接成功開始到伺服器返迴響應之間等待的最大時長。

如果你設置了一個單一的值作為 timeout，如下所示：

r = requests.get('https://github.com', timeout=5)

這一 timeout 值將會用作 connect 和 read 二者的 timeout。如果要分別制定，就傳入一個元組：

r = requests.get('https://github.com', timeout=(3.05, 27))

黑板課爬蟲闖關的第四關正好網站人為設置了一個15秒的響應等待時間，拿來做說明最好不過了。

import time
import requests

url_login = 'http://www.heibanke.com/accounts/login/?next=/lesson/crawler_ex03/'

session = requests.Session()
session.get(url_login)

token = session.cookies['csrftoken']
session.post(url_login, data={'csrfmiddlewaretoken': token, 'username': 'xx', 'password': 'xx'})

print(time.strftime('%Y-%m-%d %H:%M:%S'))

url_pw = 'http://www.heibanke.com/lesson/crawler_ex03/pw_list/'
try:
    html = session.get(url_pw, timeout=(5, 10)).text
    print('success')
except requests.exceptions.RequestException as e:
    print(e)

print(time.strftime('%Y-%m-%d %H:%M:%S'))

錯誤信息中顯示的是 read timeout（讀取超時）。

2018-12-14 15:20:47
HTTPConnectionPool(host='www.heibanke.com', port=80): Read timed out. (read timeout=10)
2018-12-14 15:20:57

讀取超時是沒有預設值的，如果不設置，程式將一直處於等待狀態。我們的爬蟲經常卡死又沒有任何的報錯信息，原因就在這裡了。

超時重試

一般超時我們不會立即返回，而會設置一個三次重連的機制。

def gethtml(url):
    i = 0
    while i < 3:
        try:
            html = requests.get(url, timeout=5).text
            return html
        except requests.exceptions.RequestException:
            i += 1

其實 requests 已經幫我們封裝好了。（但是代碼好像變多了...）

import time
import requests
from requests.adapters import HTTPAdapter

s = requests.Session()
s.mount('http://', HTTPAdapter(max_retries=3))
s.mount('https://', HTTPAdapter(max_retries=3))

print(time.strftime('%Y-%m-%d %H:%M:%S'))
try:
    r = s.get('http://www.google.com.hk', timeout=5)
    return r.text
except requests.exceptions.RequestException as e:
    print(e)
print(time.strftime('%Y-%m-%d %H:%M:%S'))

max_retries 為最大重試次數，重試3次，加上最初的一次請求，一共是4次，所以上述代碼運行耗時是20秒而不是15秒

2018-12-14 15:34:03
HTTPConnectionPool(host='www.google.com.hk', port=80): Max retries exceeded with url: / (Caused by ConnectTimeoutError(<urllib3.connection.HTTPConnection object at 0x0000000013269630>, 'Connection to www.google.com.hk timed out. (connect timeout=5)'))
2018-12-14 15:34:23

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Bootstrap -- 插件: 提示工具、彈出框、警告框消息

Bootstrap -- 插件: 提示工具、彈出框、警告框消息 ...
angularjs1.X進階筆記(3)——如何重構controller

[TOC] 本篇是內部培訓交流會的摘要總結。培訓PPT 和示例代碼已托管至我的github倉庫： "https://github.com/dashnowords/blogs/tree/master/Demo/rebuild angularjs controller" 一. 結構拆分 1. 小型 ...
"停不下來的奧爾加團長"小游戲

pygame製作"停不下來的奧爾加團長"小游戲一、pygame簡介 Pygame 是一組用來開發游戲軟體的 Python 程式模塊，基於 SDL 庫的基礎上開發。允許你在 Python 程式中創建功能豐富的游戲和多媒體程式，Pygame 是一個高可移植性的模塊可以支持多個操作系統。用它來開發小游戲 ...
設計模式之工廠模式

工廠模式一：簡單工廠模式 1. 問題的引出我們打算做一個製作pizza的系統，從訂購到出貨，初始代碼如下：客戶端通過調用pizza類的orderPizza方法來創建pizza，根據type的不同來獲取不同種類的pizza，然而以上的設計存在著很多問題： 1. Pizza類中存在大量的if el ...
讀過的設計模式的書小結

《設計模式：可復用面向對象軟體基礎》這本書還沒看完，但是絕對是案頭必備，雖然用C++寫的代碼，並且是四個牛人寫的風格（相關知識背景與程式員不同），但是一旦開始理解設計模式以後，再回過頭會發現這本書的定義和描述最容易理解和記憶。《Head First設計模式》自學、初學的推薦用書。我也是通過這本 ...
【第一篇】SAP ABAP7.50新語法之預定義數據結構

原文鏈接：SAP ABAP7.50系列之預定義數據結構公眾號：SAP Technical 前言部分先說一下，之前有些文章被轉載之後也沒有註明，這個就比較不好。如果你覺得本文寫的並不好，那麼可以直接去看HELP，這樣更直接，我這裡只是做記錄，如果讀者朋友感興趣，可以關註公眾號，也可以在本文末留言， ...
Scala(三)：類

2.帶getter和setter屬性 3.對象私有欄位在Scala中，方法可以訪問該類的所有對象的私有欄位 4.Bean屬性當你將Scala欄位標註為@BeanProperty時，會自動生成四個方法 5.輔助構造器 6.主構造器 7.嵌套類 ...
周末去面試，進去 5 分鐘就出來了…

你們可能會想，棧長這麼菜的嗎？5分鐘都堅持不了？本文說起來會有點尷尬，畢竟這是棧長我曾經經歷過的故事。。。那時候的棧長還真菜，每天寫著 if/ for 及一些簡單的業務邏輯代碼，雖工作有些日子了，但技術水平還停留在剛畢業的起步階段。。。記得，那是一個周末，棧長去某知名互聯網公司面試，好像不到五 ...