win7安裝python3.6.1及scrapy_ZenDei技術網路在線

win7安裝python3.6.1及scrapy

-Advertisement-

恢復內容開始第一篇博客，記錄自己自學python的過程及問題。首先下載python3.6.1及所需資料百度雲：https://pan.baidu.com/s/1geOEp6z 密碼：1fuw 文件列表如下：先安裝 python-3.6.1-amd64.exe。安裝完成後進入cmd,輸入py ...

---恢復內容開始---

第一篇博客，記錄自己自學python的過程及問題。

首先下載python3.6.1及所需資料

百度雲：https://pan.baidu.com/s/1geOEp6z

密碼：1fuw

文件列表如下：

先安裝 python-3.6.1-amd64.exe。

安裝完成後進入cmd,輸入python

安裝成功。

下麵安裝scrapy依賴插件。

通過命令:pip install xxxx 安裝以下文件

安裝lxml-3.7.3-cp36-cp36m-win_amd64.whl

安裝zope.interface-4.3.3-cp36-cp36m-win_amd64.whl
安裝pywin32-221-cp36-cp36m-win_amd64.whl
安裝Twisted-17.1.0-cp36-cp36m-win_amd64.whl
通過pip安裝OpenSSL: pip install pyOpenSSL

安裝之後驗證scrapy依賴項是否安裝成功的方法：

cmd執行python進入python控制台

● 執行import lxml，如果沒報錯，則說明lxml安裝成功。
● 執行import twisted，如果沒報錯，則說明twisted安裝成功。
● 執行import OpenSSL，如果沒報錯，則說明OpenSSL安裝成功。
● 執行import zope.interface，如果沒報錯，則說明zope.interface安裝成功。

下麵安裝scrapy

pip install scrapy==1.1.0rc3

安裝完成後驗證是否安裝成功，cmd輸入下麵命令

scrapy version

Scrapy 1.1.0rc3
安裝成功。
然後安裝 Microsoft Visual Studio,本人安裝的是2015專業版，安裝的時候要選上編程環境。
成功後就可以就可以新建我們的爬蟲項目測試了。
下麵以爬取百度的標題為例：
進入控制台輸出 scrapy startproject baidu

創建一個爬蟲文件

使用pyCharm進入項目,修改代碼如下

items.py

import scrapy

class BaiduItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    title = scrapy.Field()

first.py

import scrapy
from baidu.items import BaiduItem

class FirstSpider(scrapy.Spider):
    name = 'first'
    allowed_domains = ['baidu.com']
    start_urls = ['http://www.baidu.com/']

    def parse(self, response):
        item = BaiduItem()
        item["title"] = response.xpath('/html/head/title/text()').extract()
        print(item["title"])

settings.py修改下麵代碼，不遵守robots協議

ROBOTSTXT_OBEY = False

cmd執行下麵命令返回 --nolog表示不列印日誌

所有環境安裝成功。

若是執行的時候報錯

TypeError: 'float' object is not iterable

則是因為scrapy版本太低，建議手動下載高版本到本地安裝，上面分享的網盤資料有下好的文件。

進入cmd,進入文件保存目錄，執行 pip install Scrapy-1.4.0-py2.py3-none-any.whl

返回success 就OK了。

本人初學python,第一次寫博客，如果有什麼說的不准確的地方歡迎大家一起來討論。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Python全局解釋器鎖

超過十年以上，沒有比解釋器全局鎖（GIL）讓Python新手和專家更有挫折感或者更有好奇心。 Python的底層要理解GIL的含義，我們需要從Python的基礎講起。像C++這樣的語言是編譯型語言，所謂編譯型語言，是指程式輸入到編譯器，編譯器再根據語言的語法進行解析，然後翻譯成語言獨立的中間表示， ...
Java征途：行者的地圖

前段時間應因緣梳理了下自己的 Java 知識體系，成文一篇望能幫到即將走進或正在 Java 世界跋涉的程式員們。第一張，基礎圖大約在 2003 年我開始知道 Java 的（當時還在用 Delphi），但到 2004 年本科畢業才開始正式決定學習 Java。那時覺得用 Delphi 寫 C/S ...
5.Resource註解解析

Resource有兩種使用場景 1.Resource 當Resource後面沒帶參數的時候是根據它所註釋的屬性名稱到applicationContext.xml文件中查找是否有bean的id與之匹配，如果有，就將對應的class賦值給它，如果沒有則根據註釋屬性的類型到配置文件進行匹配，如果有就賦值 ...
利用ajax獲取網頁表單數據，並存儲到資料庫之一（使用JDBC）

所謂JDBC就是利用java與資料庫相連接的技術，從資料庫獲取既有的信息或者把網頁上的信息存儲到資料庫。這裡簡單的介紹公司的一個小項目中的一部分，由於代碼較多，所以用圖片形式進行展示。源碼請查看源碼庫，稍後上傳。圖1-信息圖圖2-用戶圖如上圖所示的兩個模塊，對應著資料庫當中的兩張表。第一張表 ...
命令行備忘錄 cli-memo

前言有時候想用一個簡潔點兒的備忘錄，發現沒有簡潔好用的，於是就想著開發一個，秉著簡潔的思想，所以連界面都沒有，只能通過命令行來操作（儘可能的將命令簡化）。設計的時候借鑒了git分支的思想，每個備忘錄都等同於一個分支，我們可以創建多個備忘錄。功能上可以查看所有備忘錄的名稱，切換備忘錄，添加備忘 ...
day9--隊列queue

queue隊列 Queue是python標準庫中的線程安全的隊列（FIFO）實現,提供了一個適用於多線程編程的先進先出的數據結構，即隊列，用來在生產者和消費者線程之間的信息傳遞。一個線程放入數據，另外一個線程取數據。 class queue.Queue(maxsize=0) #先入先出 class ...
JAVA 線程的幾種狀態

線程可以有六種狀態： 1.New（新創建） 2.Runnable（可運行）（運行） 3.Blocked（被阻塞） 4.Waiting（等待） 5.Timed waiting（計時等待） 6.Terminated（被終止）新創建線程：當用new操作符創建一個新線程時，如new Thread(r)， ...
Set集合、List集合

集合體系：Collection、Map介面存儲數量不等的多個對象，不能存儲基本數據類型，如存儲基本數據類型會自動裝箱 Collection的子介面：Set介面、List介面 Set介面的實現類：HashSet、LinkedHashSet、TreeSet List介面的實現類：ArrayList、L ...