node.js 抓取代理ip

来源:http://www.cnblogs.com/waterserver/archive/2017/04/30/6788734.html
-Advertisement-
Play Games

node.js實現抓取代理ip 主要文件:index.js 包支持 : package.json 本地需要安裝mongodb資料庫,用於存儲抓取到的ip,目前還未實現ip驗證。寫這個主要是處於好奇。 上面的代碼就可以實現抓取ip代理網站的ip並存到mongodb資料庫中。 下麵在放出一個基於koa2 ...


node.js實現抓取代理ip 

主要文件:index.js

/*
*  支持:node.js v7.9.0
*/
const cheerio=require('cheerio');
const fetch =require('node-fetch');
const Promise=require('bluebird');
let  mongoose=require('mongoose');

Promise.promisifyAll(mongoose);
let Schema=mongoose.Schema;
mongoose.connect('mongodb://localhost:27017/ipproxypool');
let IPpool=new Schema({
    ip:{type:String,unique:true}
})
let Ipproxy=mongoose.model('IP',IPpool);

function fetchUrl(url){
    fetch(url,{
        method:'get',
        headers:{
        }
    })
    .then(res=>res.text())
    .then(body=>{
       let $=cheerio.load(body);
       let length=$('#list table tbody').find('tr').length;
       for (let i=0;i<length;i++){
       let ipaddress= $('#list table tbody').find('tr').eq(i).find('td').eq(0).text() ;
       let port = $('#list table tbody').find('tr').eq(i).find('td').eq(1).text();
       console.log(`IP:${ipaddress}:${port}`);
       let ip=`${ipaddress}:${port}`
       let ippool=new Ipproxy({
           ip:ip
       })
       ippool.save();
       }
    })
}

var sleep = function (time) {
    return new Promise(function (resolve, reject) {
        setTimeout(function () {
            resolve('ok');
        }, time);
    })
};
const pageNumber=10;
var start = async function(){
    for(let j=1;j<pageNumber;j++){
         console.log(`當前是第${j}次等待..`);
        fetchUrl(`http://www.kuaidaili.com/free/inha/${j}/`);
        await sleep(1500);
    }
}
start();

包支持 : package.json

{
  "name": "demo-4-ipproxypool",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "author": "false-l",
  "license": "",
  "devDependencies": {
    "babel-preset-es2015": "^6.24.1",
    "babel-preset-react": "^6.24.1",
    "babel-preset-stage-3": "^6.24.1"
  },
  "dependencies": {
    "babel-core": "^6.24.1",
    "bluebird": "^3.5.0",
    "cheerio": "^0.22.0",
    "koa": "^2.2.0",
    "koa-router": "^7.1.1",
    "mongoose": "^4.9.6",
    "node-fetch": "^1.6.3"
  }
}

本地需要安裝mongodb資料庫,用於存儲抓取到的ip,目前還未實現ip驗證。寫這個主要是處於好奇。

上面的代碼就可以實現抓取ip代理網站的ip並存到mongodb資料庫中。

下麵在放出一個基於koa2的api介面的簡易伺服器實現

server

const Promise=require('bluebird');
let  mongoose=require('mongoose');
const koa=require('koa');
const app=new koa();
var router = require('koa-router')();
Promise.promisifyAll(mongoose); let Schema=mongoose.Schema; mongoose.connect('mongodb://localhost:27017/ipproxypool'); let IPpool=new Schema({ ip:{type:String,unique:true} }) let Ipproxy=mongoose.model('IP',IPpool); app.use(async (ctx, next) => { await next(); var data=await Ipproxy.find({},function(err,ips){ var ipmap=[]; ips.forEach(function(ip){ ipmap[ip._id]=ip; //console.log(ip) }); }) var map=data.map(ip=>ip.ip); ctx.response.type = 'text/json'; ctx.response.body = map; }); app.listen(3000); console.log('server listen:3000')

至於為什麼既有promise又有async,是因為對非同步語法還不是很熟,怎麼會怎麼寫了。

使用方式:

 根據package.json

npm install   // 安裝支持

node index.js  //獲取代理 ip 

node server.js  //運行簡易ip介面

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 今天接到客戶的反饋,說他們的系統無法查詢2017年2月份的賬單,原因是沒辦法選擇2017年2月份,沒辦法選擇2月份???,馬上開啟vs,運行系統,應為是去年的系統,測試數據也是去年的,就查詢了2016年2月份的數據,一切OK啊。 就讓客戶遠程,操作給我看,我就不信邪了,一遠程還真是的,一月份和三月份 ...
  • (一)認識JQuery JQuery是一個JavaScript庫,它通過封裝原生的JavaScript函數得到一套定義好的方法 JQuery的主旨:以更少的代碼,實現更多的功能 (二)JQuery的優勢 1)可以像CSS一樣訪問和操作DOM 2)修改CSS控制頁面外觀 3)簡化JS代碼操作 4)事件 ...
  • 作為一個學生黨,一開始使用atom時候並沒有意識到atom一些小功能的巨大作用。直到自己實習參與了項目,才知道這些功能在一個項目中就是能極大地提高工作效率的開發利器,這篇文章就來總結一下這些有用的功能 ...
  • 新版本 新版本的flex佈局模型是2012年9月提出的工作草案,這個草案是由W3C推出的最新語法,這個版本立志於指定標準,讓新式的瀏覽器全面相容,在未來的瀏覽器更新換代中實現統一。 目前幾乎大部分的瀏覽器都支持了。瀏覽器支持情況可以點擊這裡查看,下圖為支持flex的情況 屬性詳解 首先和之前一樣,先 ...
  • 關於Bootstrap打包的文件分別代表什麼意思,官網也沒有給出一個明確的解釋,在網上查了一些資料,總價歸納瞭如下: *bootstrap.css 是完整的bootstrap樣式表,未經壓縮過的,可供開發的時候進行調試用*bootstrap.min.css 是經過壓縮後的bootstrap樣式表,內 ...
  • 設計模式並不是某一種語言所特有的,而是一種設計理念,本文學習Javascript的設計模式中的工廠設計模式相關知識。音樂播放器的prototype屬性可以封裝成一個對象,用作父類繼承。建立工廠動態生成WangyiMusic或者QQMusic,然後生成一個QQMusic實例,並調用相應的方法。 ...
  • 簡單的兩個步驟即可實現分頁功能 totalCount':<%=totalpage%>:總頁是第一次載入頁面時查詢出的分頁表的總頁數。 'ajaxCallBack':'loehpagercallback':這裡設置回調方法,你可以將方法名修改任意你在調用頁定義的js方法 'ajaxRequestPar ...
  • 父組件結構 template script 註意的點: 子組件的拼寫方式: 寫成 這裡子組件中的綁定數據是 ,這裡的 數據是父組件中的data, 是要傳遞至子組件的屬性 子組件結構 template 註意的點: v for的遍歷對象時的參數順序 變更 具體見:https://cn.vuejs.org ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...