Windows10+Python3+BeautifulSoup4 安裝

-Advertisement-

用正則表達式來提取網頁中的內容是相當麻煩的，這裡介紹一個可以從HTML或XML文件中提取數據的Python庫：Beautiful Soup.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.Beautiful Soup ...

用正則表達式來提取網頁中的內容是相當麻煩的，這裡介紹一個可以從HTML或XML文件中提取數據的Python庫：Beautiful Soup.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.Beautiful Soup 4.2.0 文檔

具體運用在官方文檔中已經講述的很清楚了，這裡就不再贅述。說一下我安裝時遇到的問題吧。

1.安裝python3
官網下載並安裝python3，加入Path變數，把安裝好的python.exe重命名為python3.exe

2.安裝pip3
輸入：>pip3
問題提示：Fatal error in launcher: Unable to create process using '"'
輸入：>python3 -m pip install --upgrade pip
問題提示：Requirement already up-to-date: pip in c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages
輸入：>python3 -m pip install --upgrade pip --force-reinstall

輸出：

輸入：>pip3 -V

輸出：pip 9.0.1 from c:\users\****\appdata\local\programs\python\python36-32\lib\site-packages (python 3.6)

pip3安裝完成

3.安裝BeautifulSoup4

>pip3 install beautifulsoup4

如果要用源碼安裝，下載BS4的源碼 ,然後通過setup.py來安裝，

將下載的壓縮包解壓到本地，用命令轉換成Python3代碼：

進入Python的安裝目錄下的\Tools\scripts，裡面有2to3.py，用命令轉換

\Python36-32\Tools\scripts>python 2to3.py -w C:\Users\****\AppData\Local\Programs\Python\Python36-32\beautifulsoup4-4.6.0

用命令提示符進入到BS4的解壓的目錄，開始安裝：

>python setup.py install

4.安裝解析器：

>pip3 install lxml

>pip3 install html5lib

安裝完成啦！可以開始測試了。

現在網上有大量的BeautifulSoup3和Python2的代碼，對照給出的demo測試時會出現各種問題。建議學習新內容的時候直接參考官方文檔。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

機器人該不該有自己的獨立思想?

機器人發展至今技術可以說算得上非常成熟了，近日有新聞報導稱，高仿機器人有了自己的獨立思想，可以自由的與人通話，分辨談話內容，知道如何接話，並且也有豐富的面部表情，雖然看起來極不自然，但至少說明瞭這項技術目前的技術水平又達到了一個新高度，未來是否大力研發量產這些機器人是值得深思的問題，電影里也有演到未 ...
Log4Net記錄到MySql

1.新建控制台程式。 2.添加Log4Net nuget 3.添加MySql 引用 4.添加配置文件如下： <?xml version="1.0"?> <configuration> <configSections> <section name="log4net" type="log4net.Con ...
csharp: Configuring ASP.NET with Spring.NET and FluentNHibernate

Domain: FluentNhibernateLocalSessionFactoryObject.cs Dao：dataAccess.xml NHibernate 配置 Dao：objects.xml Service：objects.xml FluentNHibernateSpingNetDemo ...
背水一戰 Windows 10 (56) - 控制項（集合類）: ListViewBase - 基礎知識, 拖動項

背水一戰 Windows 10 之控制項（集合類 - ListViewBase）: 基礎知識, 拖動項 ...
使用mongodb作為Quartz.Net下的JobStore實現底層的持久化機制

我們都知道預設的Quartz底層採用的是RAMJobStore，所有的Job,Trigger,Calendar都是用Dictionary,SortSet等等這樣的數據結構進行儲存，相對來說性能肯定快的沒法說，但是面對災難重啟的時候還是很拿不出手的，而且都是全記憶體的，也沒法實現多機器搭建Quartz ...
ASP.NET Core 源碼學習之 Options[2]:IOptions

在 "上一篇" 中，介紹了一下 Options 的註冊，而使用時只需要註入 IOption 即可： IOptions IOptions 定義非常簡單，只有一個屬性： OptionsManager 而當我們註入時，其預設實現則是，在擴展方法中可以看到：而我們在使用的時候，並沒有調用擴展方法 ...
P3368 【模板】樹狀數組 2（樹狀數組維護差分序列）

題目描述如題，已知一個數列，你需要進行下麵兩種操作： 1.將某區間每一個數數加上x 2.求出某一個數的和輸入輸出格式輸入格式：第一行包含兩個整數N、M，分別表示該數列數字的個數和操作的總個數。第二行包含N個用空格分隔的整數，其中第i個數字表示數列第i項的初始值。接下來M行每行包含2或4個 ...
基礎加強_反射

JavaBean:資料庫表和實體類的對應關係 1.資料庫中有一張表,就會有一個和表對應的類資料庫:Person表 Java:Preson類 2.表中的每一列,對應Java中的一個欄位(成員變數) 3.表中的每一行,對應Java中的一個對象張三 18 男 new Person(張三 18 男); ...