python爬蟲，requests使用，網頁採集案列：搜狗爬取人物信息

-Advertisement-

一、初識爬蟲，requests使用 requests介紹： Request支持HTTP連接保持和連接池，支持使用cookie保持會話，支持文件上傳，支持自動響應內容的編碼，支持國際化的URL和POST數據自動編碼。requests會自動實現持久連接keep-alive # 導入模塊 import r ...

一、初識爬蟲，requests使用

requests介紹：

Request支持HTTP連接保持和連接池，支持使用cookie保持會話，支持文件上傳，支持自動響應內容的編碼，支持國際化的URL和POST數據自動編碼。requests會自動實現持久連接keep-alive

# 導入模塊
import requests
# 目標URL
url = 'https://www.sogou.com/'
response = requests.get(url=url)  # 發起請求，並接受
# 接受的頁面進行解析
page_text = response.text
# 列印出來
print(page_text)
# 保存到本地
with open('sogou.html', 'w', encoding='utf-8') as fp:
    fp.write(page_text)
print("結束")

二、網頁採集案列：搜狗爬取人物信息

# 導入模塊，輸入url
import requests
url = 'https://www.sogou.com/web?'

# 模擬瀏覽器UA，防止被髮現是個爬蟲
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36)'
}

# 輸入提示框（要搜索的東西）
name = input("輸入一個人名:")

# 構造payload，模擬真實數據包
param = {
    'type': 'getpinyin',
    'query': name
}

# 發起請求並接受請求到的內容
response = requests.get(url, params=param, headers=headers)

# 文本方式讀取
page_txt = response.text

# 保存網頁
filename = name + '.html'
with open(filename, 'w', encoding='utf-8') as fp:
    fp.write(page_txt)
    print("succeed")

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

【QCustomPlot】版本迭代日誌

說明使用 QCustomPlot 繪圖庫輔助開發時整理的學習筆記。本篇總結 QCustomPlot 在各版本中的更新要點，詳細更新日誌可查看 QCustomPlot 更新日誌以及各版本的 changelog 文件（部分版本沒有可以線上查看的 changelog 記錄，需要到下載界面下載對應的 ...
day01-2-依賴管理和自動配置

依賴管理和自動配置 1.依賴管理 1.1什麼是依賴管理 spring-boot-starter-parent 中還有父項目，聲明瞭開發中常用的依賴的版本號並且進行自動版本仲裁，即如果程式員沒有指定某個依賴jar的版本，則以父版本指定的版本為準 1.2修改自動仲裁/預設版本號比如我們要將Sprin ...
pheatmap實用參數（二）

# Create test matrix（造數據） set.seed(6) test = matrix(rnorm(200), 20, 10) test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3 test[11:20, seq(2, 1 ...
04 Golang 運算符

一、算術運算符運算符描述 + 相加 - 相減 * 相乘 / 相除 % 求餘代碼示例： 1 package main 2 3 import "fmt" 4 5 func main() { 6 // 算術運算符 7 a := 5 8 b := 2 9 10 fmt.Printf("a+b ...
day01-SpringBoot基本介紹

SpringBoot基本介紹 1.SpringBoot是什麼？官網地址：https://spring.io/projects/spring-boot 學習文檔：https://docs.spring.io/spring-boot/docs/2.7.10-SNAPSHOT/reference 線上A ...
【Apifox Helper】自動生成介面文檔，IDEA+Apifox懶人必備

@ 前言 🍊緣由介面文檔對接爽，整理起來真費腦對於整理API文檔，本狗秉承偷懶為上的原則，想找一種在IDEA中直接生成文檔的方法。Apifox Helper絕絕子，只需要在IDEA中下載插件，無腦配置後，文檔自動生成到Apifox，美完美解決。並且顏值及方便程度絕比Swagger和postma ...
【QCustomPlot】簡介

說明使用 QCustomPlot 繪圖庫輔助開發時整理的學習筆記。 1. 庫簡介 QCustomPlot 是一個用於科學繪圖的 QT 第三方庫，可以用於常見的二維圖像繪製，比如函數曲線、參數方程曲線、熱力圖、柱狀圖、箱線圖、極坐標繪圖等。該庫由德國人 Emanuel Eichhammer 開發，經 ...
AI來實現代碼轉換！Python轉Java，Java轉Go不在話下？

今天看到個有趣的網站，給大家分享一下。該網站的功能很神奇，可以實現編程語言的轉化。感覺在一些場景之下還是有點作用的，比如你原來跟我一樣是做Java的，因為工作需要突然轉Go。這個時候用你Java的經驗 + 這個工具，或許可以起到一定的幫助作用。工具的使用也很簡單，只需要在左側黏貼你想轉換的原始代 ...