爬蟲簡單基礎代碼_ZenDei技術網路在線

爬蟲簡單基礎代碼

-Advertisement-

以下代碼可以去掉註釋單獨運行： ...

以下代碼可以去掉註釋單獨運行：

 1 import urllib.request
 2 
 3 url = 'http://www.jianshu.com/'
 4 response = urllib.request.urlopen(url=url) #第一個參數是要打開的url 第二個是data表示post請求時 使用的 print(type(response))\
 5 #   #返回的是一個HTTPResponse對象
 6 # print(response.read())   #讀取了所有網頁的內容 包括換行符和製表符，獲取的二進位數據
 7 # print(response.read().decode('utf-8')) #解碼後進行輸出  #字元串-》位元組：編碼  encode()  位元組-》字元串：解碼  decode()
 8 # print(response.readline())  #讀取一行
 9 # print(response.readlines())  #讀取全部返回一個列表
10 # print(response.getheaders())  #返回一個響應頭信息，列表裡面有元組
11 # urllib.request.urlretrieve(url=url,filename='baidu.html') #將文件下載到本地並命名，可以下載網頁 圖片 視頻等
12 # urllib.parse #處理url的urllib.parse.urlencode 介紹post請求的時候再說這個函數
13 print(response.getheaders())
14 #編碼:因為瀏覽器並不能識別你請求裡面的中文字元
15 # 編碼
16 # string = urllib.parse.quote('http://www.baidu.com?username=狗蛋&password=123')
17 # print(string)
18 #解碼
19 # string = urllib.parse.unquote('http%3A//www.baidu.com%3Fusername%3D%E7%8B%97%E8%9B%8B%26password%3D123')
20 # print(string)

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

BZOJ2002: [Hnoi2010]Bounce 彈飛綿羊(LCT)

Description 某天，Lostmonkey發明瞭一種超級彈力裝置，為了在他的綿羊朋友面前顯擺，他邀請小綿羊一起玩個游戲。游戲一開始，Lostmonkey在地上沿著一條直線擺上n個裝置，每個裝置設定初始彈力繫數ki，當綿羊達到第i個裝置時，它會往後彈ki步，達到第i+ki個裝置，若不存在第i+ ...
實現功能站內搜索

實現一個功能即在站內搜索的時候敲入空格和沒有輸入的時候不會進行模糊搜索 ...
Python黑科技：50行代碼運用Python＋OpenCV實現人臉追蹤+詳細教程+快速入門+圖像識別+人臉識別+大神講解

嗨，我最親愛的伙計們，很高興我們又見面了。首先先感謝朋友們的關註。當然我更希望認識與電腦相關的領域的朋友咱們一起探討交流。重點說一下，我是真人，不是那些扒文章的自媒體組織，大家可以相互交流的！本篇文章我們來講一下關於AI相關的人臉追蹤，人臉識別相關的一些知識。當然本篇教程為（上）部分，講一下利 ...
Spring Boot統一異常處理方案示例

本示例以“前後端分離模式”進行演示，調試用的異常信息通過日誌的形式列印出來，代碼並不完整，僅從異常處理進行部分代碼示例。 ...
Java數據結構簡述

1、數組概念：一個存儲元素的線性集合。數組聲明和創建：二維數組（多維數組）聲明和創建： PS：數組長度必現確定的。 2、列表概念：列表是一組有序的數據。常用實現：ArrayList、LinkedList。 3、棧概念：棧是一種後入先出的數據結構。常見實現：Stack(java.util ...
模仿天貓實戰【SSM版】——後臺開發

上一篇文章鏈接： "模仿天貓實戰【SSM版】——項目起步" 後臺需求分析在開始碼代碼之前，還是需要先清楚自己要做什麼事情，後臺具體需要實現哪些功能：註意：訂單、用戶、訂單、推薦鏈接均不提供增刪的功能。後臺界面設計不像前端那樣有原型直接照搬就可以了，後臺的設計還真的有難到我...畢竟我是一個 ...
php命令行生成與讀取配置文件

接著之前的文章:php根據命令行參數生成配置文件 ghostinit.php ...
鐵樂學python_day29_模塊與包學習4

包是一種通過使用‘.模塊名’來組織python模塊名稱空間的方式。１. 無論是import形式還是from...import形式，凡是在導入語句中（而不是在使用時）遇到帶點的，都要第一時間提高警覺：這是關於包才有的導入語法。 2. 包是目錄級的（文件夾級），文件夾是用來組成py文件（包的本質就是... ...