Windows10+Python3+BeautifulSoup4 安裝

来源:http://www.cnblogs.com/jesselzj/archive/2017/06/26/7080804.html
-Advertisement-
Play Games

用正則表達式來提取網頁中的內容是相當麻煩的,這裡介紹一個可以從HTML或XML文件中提取數據的Python庫:Beautiful Soup.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.Beautiful Soup ...


用正則表達式來提取網頁中的內容是相當麻煩的,這裡介紹一個可以從HTML或XML文件中提取數據的Python庫:Beautiful Soup.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.Beautiful Soup 4.2.0 文檔

具體運用在官方文檔中已經講述的很清楚了,這裡就不再贅述。說一下我安裝時遇到的問題吧。

 

1.安裝python3
官網下載並安裝python3,加入Path變數,把安裝好的python.exe重命名為python3.exe

2.安裝pip3
輸入:>pip3
問題提示:Fatal error in launcher: Unable to create process using '"'
輸入:>python3 -m pip install --upgrade pip
問題提示:Requirement already up-to-date: pip in c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages
輸入:>python3 -m pip install --upgrade pip --force-reinstall  

輸出:

輸入:>pip3 -V

輸出:pip 9.0.1 from c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages (python 3.6)

pip3安裝完成

3.安裝BeautifulSoup4

>pip3 install beautifulsoup4

如果要用源碼安裝,下載BS4的源碼 ,然後通過setup.py來安裝,

將下載的壓縮包解壓到本地,用命令轉換成Python3代碼:

進入Python的安裝目錄下的\Tools\scripts,裡面有2to3.py,用命令轉換

\Python36-32\Tools\scripts>python 2to3.py -w C:\Users\****\AppData\Local\Programs\Python\Python36-32\beautifulsoup4-4.6.0

用命令提示符進入到BS4的解壓的目錄,開始安裝:

>python setup.py install

4.安裝解析器:

>pip3 install lxml

>pip3 install html5lib

安裝完成啦!可以開始測試了。

現在網上有大量的BeautifulSoup3和Python2的代碼,對照給出的demo測試時會出現各種問題。建議學習新內容的時候直接參考官方文檔。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 機器人發展至今技術可以說算得上非常成熟了,近日有新聞報導稱,高仿機器人有了自己的獨立思想,可以自由的與人通話,分辨談話內容,知道如何接話,並且也有豐富的面部表情,雖然看起來極不自然,但至少說明瞭這項技術目前的技術水平又達到了一個新高度,未來是否大力研發量產這些機器人是值得深思的問題,電影里也有演到未 ...
  • 1.新建控制台程式。 2.添加Log4Net nuget 3.添加MySql 引用 4.添加配置文件如下: <?xml version="1.0"?> <configuration> <configSections> <section name="log4net" type="log4net.Con ...
  • Domain: FluentNhibernateLocalSessionFactoryObject.cs Dao:dataAccess.xml NHibernate 配置 Dao:objects.xml Service:objects.xml FluentNHibernateSpingNetDemo ...
  • 背水一戰 Windows 10 之 控制項(集合類 - ListViewBase): 基礎知識, 拖動項 ...
  • 我們都知道預設的Quartz底層採用的是RAMJobStore,所有的Job,Trigger,Calendar都是用Dictionary,SortSet等等這樣的數據結構進行儲存,相對來說性 能肯定快的沒法說,但是面對災難重啟的時候還是很拿不出手的,而且都是全記憶體的,也沒法實現多機器搭建Quartz ...
  • 在 "上一篇" 中,介紹了一下 Options 的註冊,而使用時只需要註入 IOption 即可: IOptions IOptions 定義非常簡單,只有一個 屬性: OptionsManager 而當我們註入 時,其預設實現則是 ,在 擴展方法中可以看到: 而我們在使用的時候,並沒有調用 擴展方法 ...
  • 題目描述 如題,已知一個數列,你需要進行下麵兩種操作: 1.將某區間每一個數數加上x 2.求出某一個數的和 輸入輸出格式 輸入格式: 第一行包含兩個整數N、M,分別表示該數列數字的個數和操作的總個數。 第二行包含N個用空格分隔的整數,其中第i個數字表示數列第i項的初始值。 接下來M行每行包含2或4個 ...
  • JavaBean:資料庫表和實體類的對應關係 1.資料庫中有一張表,就會有一個和表對應的類 資料庫:Person表 Java:Preson類 2.表中的每一列,對應Java中的一個欄位(成員變數) 3.表中的每一行,對應Java中的一個對象 張三 18 男 new Person(張三 18 男); ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...