Hadoop新生報到(一) hadoop2.6.0偽分散式配置詳解

来源:http://www.cnblogs.com/alexfly/archive/2017/07/30/7258509.html
-Advertisement-
Play Games

首先先不看理論,搭建起環境之後再看; 搭建偽分散式是為了模擬環境,調試方便。 電腦是win10,用的虛擬機VMware Workstation 12 Pro,跑的Linux系統是centos6.5 ,裝的hadoop2.6.0,jdk1.8; 1.準備工作 準備工作:把JDK和Hadoop安裝包上傳 ...


  首先先不看理論,搭建起環境之後再看;

  搭建偽分散式是為了模擬環境,調試方便。

  電腦是win10,用的虛擬機VMware Workstation 12 Pro,跑的Linux系統是centos6.5 ,裝的hadoop2.6.0,jdk1.8;

  1.準備工作

  準備工作:把JDK和Hadoop安裝包上傳到linux系統(hadoop用戶的根目錄)

  系統環境:IP:192.168.80.99,

  linux用戶:

  root/123456,hadoop/123456

  主機名:node

  把防火牆關閉,root執行:service iptables stop

  2.jdk安裝

  1.hadoop用戶的根目錄,Jdk解壓,(hadoop用戶操作)tar -zxvf jdk-8u65-linux-x64.tar.gz 解壓完成後,在hadoop用戶的根目錄有一個jdk1.8.0_65目錄

  2.配置環境變數,需要修改/etc/profile文件(root用戶操作切到root用戶,輸入su命令 vi /etc/profile 進去編輯器後,輸入i,進入vi編輯器的插入模式profile文件最後添加

JAVA_HOME=/home/hadoop/jdk1.8.0_65

export PATH=$PATH:$JAVA_HOME/bin

  編輯完成後,按下esc退出插入模式輸入:,這時在左下角有一個冒號的標識

  q   退出不保存

  wq  保存退出

  q!   強制退出

  3.把修改的環境變數生效(hadoop用戶操作)

  執行source /etc/profile

  4.執行 java -version 查看版本,如果成功證明jdk配置成功

  

  3.Hadoop 安裝

   1.在hadoop用戶的根目錄,解壓hadoop用戶操作

    tar -zxvf hadoop-2.6.0.tar.gz

   解壓完成在hadoop用戶的根目錄下有一個hadoop-2.6.0目錄

  2.修改配置文件hadoop-2.6.0/etc/hadoop/hadoop-env.shhadoop用戶操作

    export JAVA_HOME=/home/hadoop/jdk1.8.0_65

  3.修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml,添加(hadoop用戶操作

  

<property>

<name>fs.defaultFS</name>

<value>hdfs://node:9000</value>

</property>

  4.修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml,添加hadoop用戶操作

  

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

  5.修改修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml hadoop用戶操作),這個文件沒有,需要複製一份

    cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

    添加

<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

  6.修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml,添加(hadoop用戶操作

<property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

  

  7.修改主機名稱(root用戶操作),重啟生效

    vi /etc/sysconfig/network

  修改HOSTNAME的值為用戶名

  8.修改/etc/hosts文件(root用戶操作,添加: ip 主機名稱

    192.168.44.199(用自己的ip,下邊講如何獲得)  node

  附:查看ip地址

  編輯-->虛擬網路編輯器

  net模式,選DHCP設置,得到ip地址起始

  

 net設置,得到網關

點右邊小電腦,選擇 VPN Connections-->Configue VPN

選中eth0,點有右邊edit

選擇IP Settings ,根據自己的ip按圖修改,Address就是你的ip地址,在起始ip地址和結束ip地址之間選一個就行

  9.格式化HDFS,在hadoop解壓目錄下,執行如下命令:(hadoop用戶操作

    bin/hdfs namenode -format

  註意:格式化只能操作一次,如果因為某種原因,集群不能用, 需要再次格式化,需要把上一次格式化的信息刪除,在/tmp目錄里執行 rm –rf *

  10.啟動集群,在hadoop解壓目錄下,執行如下命令:(hadoop用戶操作,截圖用機後來改過,主機為gp

    啟動集群:sbin/start-all.sh   需要輸入四次當前用戶的密碼(通過配置ssh互信解決,截圖用機已經配置過ssh不用輸密碼)

   啟動後,在命令行輸入jps有以下輸出

關閉集群:sbin/stop-all.sh  需要輸入四次當前用戶的密碼(通過配置ssh互信解決,我的同上)

 

  4.SSH互信配置(hadoop用戶操作)
  rsa加密方法,公鑰和私鑰
  1.生成公鑰和私鑰
  在命令行執行ssh-keygen,然後回車,然後會提示輸入內容,什麼都不用寫,一路回車
  在hadoop用戶根目錄下,有一個.ssh目錄
  id_rsa 私鑰
  id_rsa.pub 公鑰
  known_hosts 通過SSH鏈接到本主機,都會在這裡有記錄
  2.把公鑰給信任的主機(本機)
  在命令行輸入ssh-copy-id 主機名稱
  ssh-copy-id hadoop
  複製的過程中需要輸入信任主機的密碼
  3.驗證,在命令行輸入:ssh 信任主機名稱
  ssh hadoop
  如果沒有提示輸入密碼,則配置成功

 

   至此,大功告成。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Flume + Solr + log4j搭建web日誌採集系統 ...
  • 一.NameNode,SeconderyNamenode,DataNode NameNode,DataNode,SeconderyNamenode都是進程,運行在節點上。 1.NameNode:hadoop的主節點, 保存HDFS的元數據信息 1.fsimage - 它是在NameNode啟動時對整 ...
  • Cinnamon和Gnome3,哪個超過MAC的完美了嗎? 沒有!但是,不論到了什麼時候,總有人會喜歡自由、開源、個性化,喜歡十全九美的!在這點上,你是不是更喜歡Cinnamon了呢?亦或是選擇Gnome3呢? ...
  • 標簽:監控/SQLServer/Windows 概述 本篇文章主要介紹如何配置zabbix藉助外部郵件進行發送郵件報警,zabbix通過配置文件調用mailx來進行郵件的發送。在Centos6以上的版本預設已經安裝了mailx。 一、配置mailx 1.查看當前系統是否已安裝mailx [root@ ...
  • 使用阿裡雲個人鏡像倉庫代理方式下載如https://gcr.io等需要翻牆的鏡像; 設置github 這裡使用github作為代碼倉庫,在github中添加了名稱為Dockerfile的項目,建名稱為kube controller manager amd64的文件夾: 然後在kube control ...
  • 一、gcc gcc是Linux上面最標準的C語言的編譯程式,用來源代碼的編譯鏈接。 gcc -c hello.c 編譯產生目標文件hello.o gcc -O hello.c 編譯產生目標文件,併進行優化 gcc -o hello hello.c 生成hello這個可執行的二進位文件 缺點:命令的冗 ...
  • sed用法: 原文鏈接:http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html sed是一個很好的文件處理工具,本身是一個管道命令,主要是以行為單位進行處理,可以將數據行進行替換、刪除、新增、選取等特定工作,下麵先瞭解一下s ...
  • 用戶、組和許可權管理基礎 前言: 開始系統的學習linux已經有三周時間,最近學習了用戶、組和許可權管理的相關基礎知識。我所學的大綱將這三部分內容划到一個章節來學習,因為剛開始學linux所以接觸到的都是一些基礎性的東西。可是雖說是基礎知識,但是這三部分和在一起講內容還是蠻多的,老師上課用的PPT就有洋 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...