Node JS爬蟲：阮老師網站背景圖

-Advertisement-

有一天發現，阮一峰老師的博客圖片很好看，想收藏一下，因為幾百張，一張張下載太慢，朋友推薦了個谷歌插件（Fatkun）確實挺好用的，這之後就對爬蟲有了興趣，這個項目會整理一些簡單切實用的爬蟲代碼 **[crawler-img](https://github.com/mingjiezhou/crawle... ...

小白，輕噴，本文教你三分鐘入門爬蟲

前言

有一天發現，阮一峰老師的博客圖片很好看，想收藏一下，因為幾百張，一張張下載太慢，朋友推薦了個谷歌插件（Fatkun）確實挺好用的，這之後就對爬蟲有了興趣，這個項目會整理一些簡單切實用的爬蟲代碼 crawler-img，都是基於 Node 實現。

使用：

npm install
部分需求直接用 node 指令執行相應的 js 文件就可以實現

簡單案例：爬取阮老師網站背景圖並保存本地

一句話介紹：request 模塊可以簡化 Node 環境下的 http 請求操作，fs 是node 自帶的模塊，用來讀寫文件

安裝依賴：

npm install request --save

引入

let request = require('request');
let fs = require('fs');

核心代碼（其實總共也就這麼多~）：

for (let i=1; i< 20; i++) {
    request(`http://www.ruanyifeng.com/images_pub/pub_${i}.jpg`).pipe(fs.createWriteStream(`img/${i}.png`))
}

要註意控制併發量，對調用頻率做個限制，改進如下

function getImg(i, times){
  return new Promise(function(resolve, reject){
    setTimeout(function(){
      request(`http://www.ruanyifeng.com/images_pub/pub_${i}.jpg`).pipe(fs.createWriteStream(`img/${i}.png`))
      resolve();
    },times)
  })
  
}
async function loop() {
  for (let i=1; i<356; i++) {
    await getImg(i, 300); //每秒調用三次
  }
}
loop();

效果圖

總結

爬蟲入門是不是很簡單又好玩，你學會了嗎？

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Android獲取發佈版安全碼SHA1

未經允許,禁止🚫轉載,轉載請註明出處：https://www.cnblogs.com/YyyyQ/p/11941537.html 第1步：WIN+R輸出cmd進入命令行　找到JDK安裝路徑進入bin文件夾第2步：輸入 keytool.exe -list -keystore 加 debug.key ...
我和前端的猿糞，瞭解一下我眼中的前端。

作為一個自學前端的靚仔（小白），最開始在我的世界中是沒有前端這個概念的，相當長一段時間內，我一直把前端稱之為「做網站」，是不是有點飄？ 1、我眼中的前端點進來了這篇文章，應該會對前端稍微有那麼一點點瞭解。高大上一點說：我所見，我所得，皆為前端；大白話：嗯，就是“做網站”的。至於專業的定義，相信搜 ...
Component 和 PureComponent 的區別；複製demo，肉眼可以的區別

一個簡單的Demo，快速瞭解 React.Component 和 React.PureComponent的區別；只需複製代碼就可以看到效果； ...
css+js相關筆記

1.內聯元素垂直居中的設置; 2.頁頭,頁尾拼接; 3.圓角; 1.ajax語法; 2.判斷字元串為空的方法; 3.截取地址欄的參數; 4.用反引號(鍵盤1左邊的)做字元串拼接 ...
Element-ui 下拉列表選項過多時通過自定義搜索來解決卡頓問題

當使用Select選擇器時，如果下拉列表的數據量太多，會有一個明顯的卡頓體驗，例如: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> <script src="https:/ ...
js基礎——錯誤處理

一：錯誤捕獲 1.try-catch 語句（錯誤捕獲） try{ //這裡放置可能出現問題的代碼 }catch(error){ //錯誤發生時執行的代碼 console.log(error.name) //列印錯誤類型 console.log(error.message) //列印錯誤消息 } 說明 ...
HTML學習 day04

1、字體、文本聲明聲明語句必須要包含在{}號之中；屬性和屬性值之間用“:”分隔；當有多個屬性時，用“；”進行區分；在書寫屬性時屬性之間使用空格、換行等，並不影響屬性的顯示；如果一個屬性有多個值，則每個屬性值之間用空格分隔開。 CSS屬性字體 font size 字體大小屬性：可設置字體的 ...
JS基礎語法---作用域

作用域:使用範圍全局變數: 聲明的變數是使用var聲明的, 那麼這個變數就是全局變數全局變數可以在頁面的任何位置使用除了函數以外, 其他的任何位置定義的變數都是全局變數局部變數:在函數內部定義的變數,是局部變數,外面不能使用全局變數,如果頁面不關閉,那麼就不會釋放,就會占空間,消耗記憶體全 ...

Node JS爬蟲： 阮老師網站背景圖

前言

簡單案例：爬取阮老師網站背景圖並保存本地

效果圖

總結

Node JS爬蟲：阮老師網站背景圖