Hadoop分佈環境搭建步驟,及自帶MapReduce單詞計數程式實現

来源:https://www.cnblogs.com/zrshizr/archive/2019/01/07/10235616.html
-Advertisement-
Play Games

參考騰訊雲實驗室 Hadoop分佈環境搭建步驟: 1.軟硬體環境 CentOS 7.2 64 位 JDK- 1.8 Hadoo p- 2.7.4 2.安裝SSH sudo yum install openssh-clients openssh-server 測試: ssh localhost 測試完 ...


Hadoop分佈環境搭建步驟:

1.軟硬體環境

CentOS 7.2 64 位 JDK- 1.8 Hadoo p- 2.7.4

2.安裝SSH

sudo yum install openssh-clients openssh-server 測試: ssh localhost 測試完事 exit命令退出

3.安裝JAVA環境

sudo yum install java-1.8.0-openjdk java-1.8.0-openjdk-devel 配置:目錄root/下麵的bashrc文件結尾添加:export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk 使用命令 source ~/.bashrc 使文件生效 測試:java -version $JAVA_HOME/bin/java -version 若兩條命令輸出的結果一致,且都為我們前面安裝的 openjdk-1.8.0 的版本,則表明 JDK 環境已經正確安裝並配置

4.安裝Hadoop:

(1). 下載 Hadoop :wget https://archive.apache.org/dist/hadoop/common/hadoop-2.7.4/hadoop-2.7.4.tar.gz (2).將 Hadoop 安裝到 /usr/local 目錄下: tar -zxf hadoop-2.7.4.tar.gz -C /usr/local (3).重命名: cd /usr/local mv ./hadoop-2.7.4/ ./hadoop (4) 檢查Hadoop是否已經正確安裝:/usr/local/hadoop/bin/hadoop version

5. Hadoop 偽分散式環境配置:

(1).設置 Hadoop 的環境變數 :在 root/ 目錄下的 .bashrc,在結尾追加如下內容: export HADOOP_HOME=/usr/local/hadoop export HADOOP_INSTALL=$HADOOP_HOME export HADOOP_MAPRED_HOME=$HADOOP_HOME export HADOOP_COMMON_HOME=$HADOOP_HOME export HADOOP_HDFS_HOME=$HADOOP_HOME export YARN_HOME=$HADOOP_HOME export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin (2).使Hadoop環境變數配置生效:source ~/.bashrc (3).修改 Hadoop 的配置文件Hadoop的配置文件位於安裝目錄的 /etc/hadoop 目錄下: <!-- 編輯 core-site.xml,修改<configuration></configuration>節點的內容: --> <configuration> <property> <name>hadoop.tmp.dir</name> <value>file:/usr/local/hadoop/tmp</value> <description>location to store temporary files</description> </property> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> <!-- 編輯 hdfs-site.xml,修改<configuration></configuration>節點的內容: --> <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/data</value> </property> </configuration> (4).格式化 NameNode:/usr/local/hadoop/bin/hdfs namenode -format (5).啟動 NameNode 和 DataNode 進程:/usr/local/hadoop/sbin/start-dfs.sh 檢查是否成功:jps 如果NameNode和DataNode已經正常啟動,會顯示NameNode、DataNode和SecondaryNameNode的進程信息: [hadoop@VM_80_152_centos ~]$ jps 3689 SecondaryNameNode 3520 DataNode 3800 Jps 3393 NameNode

6.調試:自帶單詞計數程式

 

Hadoop實現自帶的MapReduce單詞計數: 第一步找到examples例子: 第二步在HDFS上面建立幾個數據目錄: hadoop fs -mkdir -p /data/wordcount hadoop fs -mkdir -p /output/ 第三步建立文件存放數據:vi /usr/inputWord 新建完成,查看內容:cat /usr/inputWord 第四步:將本地文件上傳到HDFS:hadoop fs -put /usr/inputWord /data/wordcount/ 查看上傳文件情況:hadoop fs -ls /data/wordcount 第五步運行:hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar wordcount /data/wordcount /output/wordcount 第六步顯示結果:hadoop fs -text /output/wordcount/part-r-00000    參考騰訊雲實驗室









您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近,開始學習WPF,其UI設計完全顛覆了傳統的設計理念,為程式員提供了極大的自由發揮空間,讓我為之驚嘆,且為之著迷。然而,WPF在國內的熱度卻並不高,大部分貼子都是2012年以前的,出版的圖書也很少,參考的資料不多。為了避免在以後的編程中少走彎路,也防止自己遺忘,在此記錄學習過程遇到的一些問題和感 ...
  • 通過 ASP.NET Core,開發者可輕鬆配置和管理其應用的安全性。 ASP.NET Core 中包含管理身份驗證、授權、數據保護、SSL 強制、應用機密、請求防偽保護及 CORS 管理等等安全方面的處理。 通過這些安全功能,可以生成安全可靠的 ASP.NET Core 應用。而我們這一章就來說道 ...
  • asp.net core參數保護之自定義要保護的參數類型 Intro 為了實現 asp.net core 下的參數保護,擴展了asp.net core 中 DataProtection,可以自動化的保護某些敏感參數,上次推出之後有一些小伙伴反饋希望能保護 返回的參數,本文主要以 為例介紹如何註冊自定 ...
  • 藉助表達式樹感受不一樣的CRUD Intro 最近有個想法,想不寫 sql 語句,做一個類似於 ORM 的東西,自己解析表達式樹,生成要執行的 sql 語句,最後再執行 sql 語句,返回相應結果。 思路解析 常用的 sql 語句基本都有一定的模式,就是 /`DELETE Update SELECT ...
  • 寫在最前:控制台輸出中文亂碼,完全是跟win10操作系統有關,跟VS基本無關,所以網上大量的用VS下載安裝更新的解決辦法是事倍功半的(而且不一定成功),本文的方法只需幾個簡單的步驟,就能解決中文亂碼問題,簡單明快。 本文參照此網友blog:https://blog.csdn.net/C_Khalid ...
  • 一. 依賴註入概述 在軟體設計的通用原則中,SOLID是非常流行的縮略語,它由5個設計原則的首字母構成:單一原則(S)、開放封閉原則(O)、里氏替換原則(L)、介面分離原則(I)、依賴反轉原則(D)。本篇介紹依賴反轉原則以及在ASP.NET Core中的實現。 直接依賴是指:當一個類需要另一個類協作 ...
  • 一、前言 在項目開發中,日誌系統是系統的一個重要組成模塊,通過在程式中記錄運行日誌、錯誤日誌,可以讓我們對於系統的運行情況做到很好的掌控。同時,收集日誌不僅僅可以用於診斷排查錯誤,由於日誌同樣也是大量的數據,通過對這些數據進行集中分析,可以產生極大的價值。 在微服務的系統架構中,由於一個系統會被拆成 ...
  • 1、基於功能變數名稱的虛擬主機: 絕大多數企業對外提供服務的網站使用的都是基於功能變數名稱的主機,通過不同的功能變數名稱區分不同的虛擬主機。 首先我們進入安裝nginxd的目錄下:/application/nginx-1.6.3/conf 我們去除掉預設配置文件里的註釋和空行並重定向到nginx.conf文件里,同時我們需 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...