一、error 1.URLError產生的原因:(1)沒有網路;(2)伺服器連接失敗;(3)不知道指定伺服器;(4)是OSError的子類 from urllib import request,error if __name__ == "__main__": url = "http://www. ...
一、error
1.URLError產生的原因:(1)沒有網路;(2)伺服器連接失敗;(3)不知道指定伺服器;(4)是OSError的子類
from urllib import request,error if __name__ == "__main__": url = "http://www.baidu.comfdsfdfsf" try: req = request.Request(url) rsp = request.urlopen(req) html = rsp.read().decode() print(html) except error.URLError as e: print("URLError:{0}".format(e.reason)) print("URLError:{0}".format(e)) except Exception as e: print(e)
2.HTTPError是URLError的一個子類
3.兩者區別:HTTPError是對應的HTTP請求的返回碼錯誤,如果返回錯誤碼碼是400以上的,則引發HTTPError;URLError對應的一般時網路出現問題,包括url問題;關係區別:OSError-URLError-HTTPError
二、useragent
1.UserAgent:用戶代理,簡稱UA,屬於heads的一部分,伺服器通過UA來判斷訪問者身份;常見的UA值,使用的時候可以直接複製粘貼,也可以用瀏覽器訪問的時候抓包。如下麵的鏈接:
https://blog.csdn.net/wangqing84411433/article/details/89600335
2.設置UA可以通過兩種方式:heads\
url2 = "http://www.baiu.com" try: #使用head方法偽裝UA headers = {} headers["User-Agent"] = "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko" req2 = request.Request(url2,headers=headers) rsp2 = request.urlopen(req2) html2 = rsp2.read().decode() print(html2) except error.HTTPError as e: print("URLError:{0}".format(e.reason)) print("URLError:{0}".format(e)) except error.URLError as e: print("URLError:{0}".format(e.reason)) print("URLError:{0}".format(e)) except Exception as e: print(e)
也可以把
req2 = request.Request(url2,headers=headers)
改成如下形式也可以
req2 = request.Request(url2) req2.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko")
三、源碼
Reptile4_ErrrorAndUserAgent.py
https://github.com/ruigege66/PythonReptile/blob/master/Reptile4_ErrrorAndUserAgent.py
2.CSDN:https://blog.csdn.net/weixin_44630050
3.博客園:https://www.cnblogs.com/ruigege0000/
4.歡迎關註微信公眾號:傅里葉變換,個人公眾號,僅用於學習交流,後臺回覆”禮包“,獲取大數據學習資料