win7安裝python3.6.1及scrapy

来源:http://www.cnblogs.com/365283fandf/archive/2017/09/09/7499606.html
-Advertisement-
Play Games

恢復內容開始 第一篇博客,記錄自己自學python的過程及問題。 首先下載python3.6.1及所需資料 百度雲:https://pan.baidu.com/s/1geOEp6z 密碼:1fuw 文件列表如下: 先安裝 python-3.6.1-amd64.exe。 安裝完成後進入cmd,輸入py ...


---恢復內容開始---

第一篇博客,記錄自己自學python的過程及問題。

首先下載python3.6.1及所需資料

百度雲:https://pan.baidu.com/s/1geOEp6z

密碼:1fuw

文件列表如下:

先安裝 python-3.6.1-amd64.exe。

安裝完成後進入cmd,輸入python

安裝成功。

下麵安裝scrapy依賴插件。

通過命令:pip install xxxx 安裝以下文件

安裝lxml-3.7.3-cp36-cp36m-win_amd64.whl

安裝zope.interface-4.3.3-cp36-cp36m-win_amd64.whl
安裝pywin32-221-cp36-cp36m-win_amd64.whl
安裝Twisted-17.1.0-cp36-cp36m-win_amd64.whl
通過pip安裝OpenSSL: pip install pyOpenSSL

 

安裝之後驗證scrapy依賴項是否安裝成功的方法:

cmd執行python進入python控制台

● 執行import lxml,如果沒報錯,則說明lxml安裝成功。
● 執行import twisted,如果沒報錯,則說明twisted安裝成功。
● 執行import OpenSSL,如果沒報錯,則說明OpenSSL安裝成功。
● 執行import zope.interface,如果沒報錯,則說明zope.interface安裝成功。

下麵安裝scrapy

pip install scrapy==1.1.0rc3 

安裝完成後驗證是否安裝成功,cmd輸入下麵命令

scrapy version

返回

Scrapy 1.1.0rc3
安裝成功。
然後安裝 Microsoft Visual Studio,本人安裝的是2015專業版,安裝的時候要選上編程環境。
成功後就可以就可以新建我們的爬蟲項目測試了。
下麵以爬取百度的標題為例:
進入控制台輸出 scrapy startproject baidu

創建一個爬蟲文件

使用pyCharm進入項目,修改代碼如下

items.py

import scrapy

class BaiduItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    title = scrapy.Field()

first.py

import scrapy
from baidu.items import BaiduItem

class FirstSpider(scrapy.Spider):
    name = 'first'
    allowed_domains = ['baidu.com']
    start_urls = ['http://www.baidu.com/']

    def parse(self, response):
        item = BaiduItem()
        item["title"] = response.xpath('/html/head/title/text()').extract()
        print(item["title"])

settings.py修改下麵代碼,不遵守robots協議

ROBOTSTXT_OBEY = False

cmd執行下麵命令返回  --nolog表示不列印日誌

所有環境安裝成功。

若是執行的時候報錯

TypeError: 'float' object is not iterable

 則是因為scrapy版本太低,建議手動下載高版本到本地安裝,上面分享的網盤資料有下好的文件。

進入cmd,進入文件保存目錄,執行 pip install Scrapy-1.4.0-py2.py3-none-any.whl

返回success 就OK了。

本人初學python,第一次寫博客,如果有什麼說的不准確的地方歡迎大家一起來討論。



您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 超過十年以上,沒有比解釋器全局鎖(GIL)讓Python新手和專家更有挫折感或者更有好奇心。 Python的底層 要理解GIL的含義,我們需要從Python的基礎講起。像C++這樣的語言是編譯型語言,所謂編譯型語言,是指程式輸入到編譯器,編譯器再根據語言的語法進行解析,然後翻譯成語言獨立的中間表示, ...
  • 前段時間應因緣梳理了下自己的 Java 知識體系, 成文一篇望能幫到即將走進或正在 Java 世界跋涉的程式員們。 第一張,基礎圖 大約在 2003 年我開始知道 Java 的(當時還在用 Delphi),但到 2004 年本科畢業才開始正式決定學習 Java。 那時覺得用 Delphi 寫 C/S ...
  • Resource有兩種使用場景 1.Resource 當Resource後面沒帶參數的時候是根據它所註釋的屬性名稱到applicationContext.xml文件中查找是否有bean的id與之匹配,如果有,就將對應的class賦值給它, 如果沒有則根據註釋屬性的類型到配置文件進行匹配,如果有就賦值 ...
  • 所謂JDBC就是利用java與資料庫相連接的技術,從資料庫獲取既有的信息或者把網頁上的信息存儲到資料庫。 這裡簡單的介紹公司的一個小項目中的一部分,由於代碼較多,所以用圖片形式進行展示。源碼請查看源碼庫,稍後上傳。 圖1-信息圖 圖2-用戶圖 如上圖所示的兩個模塊,對應著資料庫當中的兩張表。第一張表 ...
  • 前言 有時候想用一個簡潔點兒的備忘錄,發現沒有簡潔好用的,於是就想著開發一個,秉著簡潔 的思想,所以連界面都沒有,只能通過命令行來操作(儘可能的將命令簡化)。設計的時候 借鑒了git分支的思想,每個備忘錄都等同於一個分支,我們可以創建多個備忘錄。功能上 可以查看所有備忘錄的名稱,切換備忘錄,添加備忘 ...
  • queue隊列 Queue是python標準庫中的線程安全的隊列(FIFO)實現,提供了一個適用於多線程編程的先進先出的數據結構,即隊列,用來在生產者和消費者線程之間的信息傳遞。一個線程放入數據,另外一個線程取數據。 class queue.Queue(maxsize=0) #先入先出 class ...
  • 線程可以有六種狀態: 1.New(新創建) 2.Runnable(可運行)(運行) 3.Blocked(被阻塞) 4.Waiting(等待) 5.Timed waiting(計時等待) 6.Terminated(被終止) 新創建線程: 當用new操作符創建一個新線程時,如new Thread(r), ...
  • 集合體系:Collection、Map介面 存儲數量不等的多個對象,不能存儲基本數據類型,如存儲基本數據類型會自動裝箱 Collection的子介面:Set介面、List介面 Set介面的實現類:HashSet、LinkedHashSet、TreeSet List介面的實現類:ArrayList、L ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...