網頁獲取_ZenDei技術網路在線

網頁獲取

-Advertisement-

網頁獲取一般使用requests庫。 requests庫 1、定義：requests庫是個簡潔而且簡單的處理HTTP請求的第三方庫。 2、requests庫中的網頁請求函數：函數描述 get(url,[,timeout = n]) 對應HTTP的GET方式，獲取網頁的最常用的方法，可增加time ...

網頁獲取一般使用requests庫。

requests庫

1、定義：requests庫是個簡潔而且簡單的處理HTTP請求的第三方庫。

2、requests庫中的網頁請求函數：

函數	描述
get(url,[,timeout = n])	對應HTTP的GET方式，獲取網頁的最常用的方法，可增加timeout=n參數，設定每次請求超時時間為n秒
post(url,data = {'key':'value'})	對應HTTP的POST方式，其中字典用於傳遞客戶數據
delete(url)	對應HTTP的DELETE方式
head(url)	對應HTTP的HEAD方式
options(url)	對應HTTP的OPTIONS方式
put(url,data = {'key':'value'})	對應HTTP的PUT方式，其中字典用於傳遞客戶數據

註：get()是獲取網頁的最常用的方法，在調用requests.get()函數後，返回的網頁內容會保存為一個Response對象，其中，get()函數的參數url必須鏈接採用HTTP或HTTPS方式訪問。

3、Response對象的屬性：

屬性	描述
status_code	HTTP請求的返回狀態，整數，200表連接成功，404表失敗
text	HTTP響應內容的字元串形式，即，也是url對應的頁面內容
encoding	HTTP響應內容的編碼形式
content	HTTP響應內容的二進位形式

例1：

4、Response對象的方法：

方法	描述
json()	如果HTTP響應內容包含json格式數據，該方法解析JSON數據
raise_for_status()	如果不是200，該方法就會產生異常

5、網頁獲取

import requests
def gethtml(url):
    try:
        r = requests.get(url,timeout = 30)
        r.raise_for_status()
        r.encoding = 'utf-8'
        return r.text
    except:
        return ""
url = "http://www.baidu.com"
print(gethtml(url))

　　結果如下：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Python四大數據類型最全總結。你都會嗎？

基本數據類型數值型 Python 中的數據皆是對象，比如被熟知的 int 整型對象、float 雙精度浮點型、bool 邏輯對象，它們都是單個元素。舉兩個例子。首碼加 0x，創建一個十六進位的整數： 0xa5 # 等於十進位的 165 使用 e 創建科學計數法表示的浮點數： 1.05e3 # 1 ...
教你從防護角度看Thinkphp歷史漏洞

一、前言 19年初，網上公開了2個Thinkphp5的RCE漏洞，漏洞非常好用，導致有很多攻擊者用掃描器進行全網掃描。我們通過ips設備持續觀察到大量利用這幾個漏洞進行批量getshell的攻擊流量，本文主要從流量角度簡要分析和利用thinkphp進行攻擊的全網掃描和getshell流量痕跡。二、 ...
python中的反射

python反射簡介所謂反射是指通過字元串的方式獲取對象，然後執行對象的屬性或方法。在python中一切皆對象，因此我們可以對一切事物進行發射。關於反射python為我們提供了四個方法： hasattr(object, name)：name必須是字元串，如果字元串name是object對象當中的 ...
thinkphp無限分類模塊實現

數據表結構如下：控制器核心代碼： <?php namespace app\index\controller; use think\Controller; class Goods extends Controller { public function product_category() { re ...
Spring Boot 使用 Maven 定製一個 parent 簡化開發

1/ 場景有很多小應用，有一些公共的特點，比如說都依賴了spring boot、log4j2、lombok、fastjson等等，為了方便開發，可以使用Maven定製一個parent來簡化開發，統一管理第三方依賴的版本。（為後續的微服務做準備哦！） 2/ 構建 parent 2.1. 新建一個Ma ...
C++ 靜態持續變數

鏈接性：外部、內部、無存儲：固定的記憶體塊（即整個程式執行期間存在）創建：外部鏈接性：代碼塊的外部聲明內部鏈接性：代碼塊的外部且用 static 聲明無鏈接性：代碼塊內且用 static 聲明初始化：靜態初始化：（預設）零初始化：未被初始化的靜態變數的所有位都被設置為 0 常量表達式初 ...
給大家發個Python和Django的福利吧，不要錢的那種~~~

前言一：這篇是一個發放福利的文章，但是發放之前，我還是想跟大家聊聊我為什麼要發這樣的福利。我第一份工作是做的IT桌面支持，日常工作就是給同事修修電腦、裝裝軟體、開通賬號、維護內部系統之類的基礎工作。工作了半年，適應了職場環境，工作也穩定下來，每天干的都是一些重覆的枯燥的工作。我的隔壁部門就是 ...
opencv-12-高斯濾波-雙邊濾波(附C++代碼實現)

開始之前這幾天由於自己的原因沒有寫, 一個是因為自己懶了, 一個是感覺這裡遇到點問題不想往下寫了, 我們先努力結束這個章節吧, 之前介紹了比較常用而且比較好理解的均值和中值濾波, 但是呢,在常式 "Smoothing Images" , 還有給出的其他的濾波方式, 主要是高斯濾波和雙邊濾波, 我們 ...