學習node從0做一個爬蟲,有朋友留言說想學習一下VUE,我整理了之前自學時候的學習資源分享給大家。

来源:https://www.cnblogs.com/ganuo/archive/2018/07/19/9335325.html
-Advertisement-
Play Games

最近從網上學習關於node爬蟲的知識,整理了一下分享一下扒去糗事百科的過程。博主新人,剛學習,勿噴。後期會整理好學習node的學習資源分享給大家。VUE學習資源在文章最後。 從零開始: 1、首先需要的是安裝node環境 具體的安裝過程就不詳細闡述了~請看這篇教程: Node.js 安裝配置 node ...


最近從網上學習關於node爬蟲的知識,整理了一下分享一下扒去糗事百科的過程。博主新人,剛學習,勿噴。後期會整理好學習node的學習資源分享給大家。VUE學習資源在文章最後。

從零開始:

1、首先需要的是安裝node環境

具體的安裝過程就不詳細闡述了~請看這篇教程: 
Node.js 安裝配置 
nodejs官方網站

檢測安裝是否完成在命令行中輸入: 
node -v 

看能否顯示版本號

 


 

 

好的,安裝完成~

2、接下來開始初始化一個項目~

關於編寫代碼的IDE,我現在用的是集成化工具是webstorm,輕量級的是sublime text3

這裡以webstorm為例

首先新建一個空白的工程

創建完成,其實就只是一個創建了一個空的文件夾(這個也可以通過使用命令行mkdir來創建一個空文件夾,再進入文件夾內 )

點擊下方的Terminal,把控制台點開(其實就是windows自帶的命令行,其他系統同理)

輸入命令: npm init

這一步初始化一個node工程,生成一個package.json來儲存工程的信息

一路回車即可

然後可以看到多出了一個package.json文件

打開package.json,我們再裡面添加項目依賴項

增加dependencies欄位,添加cherrio和request兩個依賴項

{
  "name": "spider-demo",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "author": "",
  "license": "ISC",
  "dependencies": {
    "cheerio":      "0.12.3",
    "request":      "2.27.0"
  }
}

 

3、然後在控制臺中輸入命令: npm update

npm包管理器自動從倉庫中拉取依賴項並放在項目下了

如果有warn的話暫時不要管,沒什麼大的影響

好的,項目創建完成,我們來新建一個index.js文件來寫代碼

首先引入我們剛纔下載好的2個依賴項

var request = require('request');
var cheerio = require('cheerio');

request模塊是用來請求網頁的,cherrio是用來分析dom結構的

4、接下來我們找到糗事百科的網站 index.js

5、在控制台輸入: node index.js 我們來看下。

 

 這樣就能獲取到基本數據了。前三步參考的網上方法,複製過來的,原諒我。VUE資源:入門和一個app項目資源,老套路,不要噴我,關註我公眾號回覆 vue 就可以了。不要取關啊,很傷心的。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在我們的周邊微信密碼被破譯的情況經常會出現。近日,在網上便有一種關於亂加微信密碼會被破譯的話語存在。事實上,許多人表示自己在加了一些不認識的人的微信之後,人家便可以通過自己的軟體里的自動碰號,然後將微信綁定的銀行卡的密碼給破譯掉,這主要是由於自己設置的微信密碼過於簡單所致。 事實上,近日在網上有很多 ...
  • 這裡主要總結記錄下表格的一些屬性和簡單的樣式,方便以後不時之需。 1、<table> 用來定義HTML的表格,具有本地屬性 border 表示邊框,border屬性的值必須為1或空字元串("")。該屬性不會控制邊框的樣式,而是由CSS來控制 table元素可以有tr,th,td,thead,tbod ...
  • angularJs模板緩存的清除,包括傳統的 HTML標簽設置清除緩存,以及angularJs的一些配置清除,和angularJs的路由切換操作清除 ...
  • 當今大多數的團隊都實現了前、後端分支。前端與後端的溝通都是通過介面來實現的(一般情況下都是webapi介面)。這種情況你肯定需要一個介面查詢的幫助文檔,這個當然用swagger都可以實現。但做為前端開發的我們是否也應該考慮把自己寫的組件以幫助文檔的方式公開都團隊其他人員使用。就像iview,easy ...
  • cordova-plugin-themeablebrowser 0.2.17 "ThemeableBrowser"ionic跳轉外鏈插件在ios中heardBar會遮住內容的bug ...
  • 1.高性能CSS3動畫 與PC端場景需要相比,移動web端需要考慮的因素也相對複雜,重點考慮:流量、功耗與流暢度。在pc端上考慮更多的是流暢度,而mobile web中需要考慮網路流量的使用和耗電情況。 關於流暢度,在前端動畫中主要有兩種:JS動畫與CSS3動畫。 JS動畫是通過JS動態改寫樣式實現 ...
  • <sup> 標簽可定義上標文本。 包含在 <sup> 標簽和其結束標簽 </sup> 中的內容將會以當前文本流中字元高度的一半來顯示,但是與當前文本流中文字的字體和字型大小都是一樣的。 提示:這個標簽在向文檔添加腳註以及表示方程式中的指數值時非常有用。如果和 <a> 標簽結合起來使用,就可以創建出很好的 ...
  • 最近項目需要在頁面彈窗的時候需要點擊彈窗區域外的地方,其實也就是點擊頁面HTML就可以關閉彈窗, 首先在controller通過js獲取到html的dom節點,然後綁定點擊事件,話不多說上代碼: var htmlEl = angular.element(document.querySelector( ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...