Node JS爬蟲: 阮老師網站背景圖

来源:https://www.cnblogs.com/zhoumingjie/archive/2019/11/28/11950322.html
-Advertisement-
Play Games

有一天發現,阮一峰老師的博客圖片很好看,想收藏一下,因為幾百張,一張張下載太慢,朋友推薦了個谷歌插件(Fatkun)確實挺好用的,這之後就對爬蟲有了興趣,這個項目會整理一些簡單切實用的爬蟲代碼 **[crawler-img](https://github.com/mingjiezhou/crawle... ...


小白,輕噴,本文教你三分鐘入門爬蟲

前言

有一天發現,阮一峰老師的博客圖片很好看,想收藏一下,因為幾百張,一張張下載太慢,朋友推薦了個谷歌插件(Fatkun)確實挺好用的,這之後就對爬蟲有了興趣,這個項目會整理一些簡單切實用的爬蟲代碼 crawler-img,都是基於 Node 實現。

使用:

  1. npm install
  2. 部分需求直接用 node 指令執行相應的 js 文件就可以實現

簡單案例:爬取阮老師網站背景圖並保存本地

一句話介紹:request 模塊可以簡化 Node 環境下的 http 請求操作,fs 是node 自帶的模塊,用來讀寫文件

安裝依賴:

npm install request --save

引入

let request = require('request');
let fs = require('fs');

核心代碼(其實總共也就這麼多~):

for (let i=1; i< 20; i++) {
    request(`http://www.ruanyifeng.com/images_pub/pub_${i}.jpg`).pipe(fs.createWriteStream(`img/${i}.png`))
}

要註意控制併發量,對調用頻率做個限制,改進如下

function getImg(i, times){
  return new Promise(function(resolve, reject){
    setTimeout(function(){
      request(`http://www.ruanyifeng.com/images_pub/pub_${i}.jpg`).pipe(fs.createWriteStream(`img/${i}.png`))
      resolve();
    },times)
  })
  
}
async function loop() {
  for (let i=1; i<356; i++) {
    await getImg(i, 300); //每秒調用三次
  }
}
loop();

效果圖

總結

爬蟲入門是不是很簡單又好玩,你學會了嗎?


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 未經允許,禁止🚫轉載,轉載請註明出處:https://www.cnblogs.com/YyyyQ/p/11941537.html 第1步:WIN+R輸出cmd進入命令行 找到JDK安裝路徑進入bin文件夾 第2步:輸入 keytool.exe -list -keystore 加 debug.key ...
  • 作為一個自學前端的靚仔(小白),最開始在我的世界中是沒有前端這個概念的,相當長一段時間內,我一直把前端稱之為「做網站」,是不是有點飄? 1、我眼中的前端 點進來了這篇文章,應該會對前端稍微有那麼一點點瞭解。 高大上一點說:我所見,我所得,皆為前端;大白話:嗯,就是“做網站”的。至於專業的定義,相信搜 ...
  • 一個簡單的Demo,快速瞭解 React.Component 和 React.PureComponent的區別;只需複製代碼就可以看到效果; ...
  • 1.內聯元素垂直居中的設置; 2.頁頭,頁尾拼接; 3.圓角; 1.ajax語法; 2.判斷字元串為空的方法; 3.截取地址欄的參數; 4.用反引號(鍵盤1左邊的)做字元串拼接 ...
  • 當使用Select選擇器時,如果下拉列表的數據量太多,會有一個明顯的卡頓體驗,例如: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> <script src="https:/ ...
  • 一:錯誤捕獲 1.try-catch 語句(錯誤捕獲) try{ //這裡放置可能出現問題的代碼 }catch(error){ //錯誤發生時執行的代碼 console.log(error.name) //列印錯誤類型 console.log(error.message) //列印錯誤消息 } 說明 ...
  • 1、字體、文本聲明 聲明語句必須要包含在{}號之中; 屬性和屬性值之間用“:”分隔; 當有多個屬性時,用“;”進行區分; 在書寫屬性時屬性之間使用空格、換行等,並不影響屬性的顯示; 如果一個屬性有多個值,則每個屬性值之間用空格分隔開。 CSS屬性 字體 font size 字體大小屬性:可設置字體的 ...
  • 作用域:使用範圍 全局變數: 聲明的變數是使用var聲明的, 那麼這個變數就是全局變數 全局變數可以在頁面的任何位置使用 除了函數以外, 其他的任何位置定義的變數都是全局變數 局部變數:在函數內部定義的變數,是局部變數,外面不能使用 全局變數,如果頁面不關閉,那麼就不會釋放,就會占空間,消耗記憶體 全 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...