在Ubuntu X64上編譯Hadoop

来源:http://www.cnblogs.com/studyzy/archive/2016/12/12/6165105.html
-Advertisement-
Play Games

在之前的文章中介紹瞭如何直接在Ubuntu中安裝Hadoop。但是對於64位的Ubuntu來說,官方給出的Hadoop包是32位的,運行時會得到警告: WARN util.NativeCodeLoader: Unable to load native-hadoop library for your ...


在之前的文章中介紹瞭如何直接在Ubuntu中安裝Hadoop。但是對於64位的Ubuntu來說,官方給出的Hadoop包是32位的,運行時會得到警告:

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

所以我們最好是自己在Ubuntu中編譯Hadoop。先介紹一下我的環境是Ubuntu 16.1 X64 Server版,當前最新的Hadoop是2.7.3。我們可以先下載源代碼,在其中有BUILDING.txt,指導我們如何在Ubuntu中編譯Hadoop:

Installing required packages for clean install of Ubuntu 14.04 LTS Desktop:

* Oracle JDK 1.7 (preferred)
  $ sudo apt-get purge openjdk*
  $ sudo apt-get install software-properties-common
  $ sudo add-apt-repository ppa:webupd8team/java
  $ sudo apt-get update
  $ sudo apt-get install oracle-java7-installer
* Maven
  $ sudo apt-get -y install maven
* Native libraries
  $ sudo apt-get -y install build-essential autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev
* ProtocolBuffer 2.5.0 (required)
  $ sudo apt-get -y install libprotobuf-dev protobuf-compiler

Optional packages:

* Snappy compression
  $ sudo apt-get install snappy libsnappy-dev
* Bzip2
  $ sudo apt-get install bzip2 libbz2-dev
* Jansson (C Library for JSON)
  $ sudo apt-get install libjansson-dev
* Linux FUSE
  $ sudo apt-get install fuse libfuse-dev

 

我用的Linux16.1 X64 Server版本,也是大同小異,接下來是編譯Hadoop的過程:

1.更新apt源

首先需要更新我們的apt源,因為如果是國外源的話,接下來安裝會很慢。使用命令

sudo vi /etc/apt/sources.list

打開這個apt源列表,如果其中看到是http://us.xxxxxx之類的,那麼就是外國的,如果看到是http://cn.xxxxx之類的,那麼就不用換的。我的是美國的源,所以需要做一下批量的替換。在命令模式下,輸入:

:%s/us./cn./g

就可以把所有的us.改為cn.了。然後輸入:wq即可保存退出。

sudo apt-get update

更新一下源。

2.安裝必備軟體

2.1安裝SSH

sudo apt-get install ssh

安裝完畢後我們就可以用putty或者SecureCRT連接到Ubuntu了。

2.2安裝JDK

sudo apt-get install default-jdk

安裝後可以運行java –version看安裝的版本

2.3安裝Maven

sudo apt-get install maven

這是編譯Hadoop的工具,安裝完成後,可以運行mvn -–version看安裝的版本

2.4安裝依賴庫

sudo apt-get install g++ autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev

2.5安裝ProtocolBuffer 2.5.0

註意,我要編譯的是Hadoop2.7.3,必須安裝的ProtocolBuffer是2.5這個版本,如果不是的話,接下來會編譯失敗:

protoc version is 'libprotoc 3.0.0, expected version is '2.5.0'

如果我們運行文檔中的:

sudo apt-get -y install libprotobuf-dev protobuf-compiler

protoc –version 會告訴我們安裝的是3.0版本,這是不對的。我們需要的是2.5版。怎麼辦呢?只有去GitHub找到2.5版,然後重新編譯安裝。過程如下:

wget https://github.com/google/protobuf/releases/download/v2.5.0/protobuf-2.5.0.tar.gz
tar -xzf protobuf-2.5.0.tar.gz
cd protobuf-2.5.0/
./autogen.sh
./configure
make
make install
現在我們重新運行protoc –version 會看到版本是2.5了。
2.6更新Maven鏡像
由於Maven預設連接的是國外的伺服器,會很慢,所以我們需要更新Maven源為國內的伺服器。推薦還有阿裡雲的Maven源:http://maven.aliyun.com/
具體做法是:
cd ~/.m2 (如果沒有這個文件夾,那麼就在~目錄mkdir .m2創建這個文件夾)
vi settings.xml
然後輸入以下的內容:
<settings xmlns="http://maven.apache.org/SETTINGS/1.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/SETTINGS/1.0.0 http://maven.apache.org/xsd/settings-1.0.0.xsd">
<mirrors>
<mirror>
<id>nexus-aliyun</id>
<mirrorOf>*</mirrorOf>
<name>Nexus aliyun</name>
<url>http://maven.aliyun.com/nexus/content/groups/public</url>
</mirror>
</mirrors>
</settings>

3.編譯Hadoop

首先我們下載最新的Hadoop源代碼,訪問官網http://hadoop.apache.org/releases.html,可以看到最新的是2.7.3,所以我們點擊2.7.3的source,會給我們一個比較快的下載地址。

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3-src.tar.gz

下載完畢後解壓:

tar -zxvf hadoop-2.7.3-src.tar.gz

cd hadoop-2.7.3-src

最後,就是用Maven編譯Hadoop:

mvn package -Pdist,native -DskipTests –Dtar

這是一個比較漫長的過程,可能要等10~20來分鐘。如果一切正常,那麼運行完畢後,我們會看到成功編譯的通知:

image

我是在虛擬機中,花了23分鐘,我們的Hadoop X64版本就編譯出來了。

編譯好的Hadoop是在:

hadoop-dist/target/ 目錄下,hadoop-2.7.3.tar.gz文件便是

我們可以把這個包下載到本地,或者傳輸到其他伺服器,接下來就是用這個包安裝Hadoop,具體安裝配置過程參見我這篇博客

 

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 示例一:實現通知欄管理 當針對相同類型的事件多次發出通知,作為開發者,應該避免使用全新的通知,這時就應該考慮更新之前通知欄的一些值來達到提醒用戶的目的。例如我們手機的簡訊系統,當不斷有新消息傳來時,我們的通知欄僅僅是更改傳來簡訊的數目,而不是對每條簡訊單獨做一個通知欄用於提示。 修改通知 可以設置一 ...
  • 今天在寫微信登錄,花了半天時間搞定、然後寫下自己的筆記,希望幫助更多的人。。。歡迎各位指教。 微信授權登錄,官方說的不是很清楚、所以導致有一部分的坑。 微信註冊應用平臺的應用簽名,下載 微信簽名生成工具 輸入項目的packageName也可以查看到。 (註意:debug、Release 一定要區分, ...
  • 在SQL Server中導入數據時,會有一個“啟用標示插入”的選項,突然間懵逼了,這到底啥意思?我選與不選這個選項,結果好像沒區別!不科學啊這,“存在即合理”,我相信這個選項肯定有它的用處,只是我不知道罷了。 於是我去查資料,在CSDN論壇里找到了可能的解釋: 1)首先:“啟用標示插入”只對標示列( ...
  • 事務 事務是作為單個邏輯工作單元執行的一系列操作。一個邏輯工作單元必須有四個屬性,稱為原子性、一致性、隔離性和持久性 (ACID) 屬性,只有這樣才能成為一個事務。 事務併發 資料庫是多個用戶(事務)共用的,當多個用戶同時訪問數據時,那麼在這種情況下就叫做併發。 事務併發下可能出現的問題 更新丟失 ...
  • oracle資料庫中,數據的增、刪、改、查,通過SQL語句實現 SQL:結構化查詢語言; 特點:不區分大小寫;字元串用單引號引起來;語句結束用分號表示結束; 行註釋,在語句的最前面加“--” 塊註釋,分別在語句的前後加 /* 和 */ SQL中常用的幾類: 一、數據定義語言 DDL:創建、修改、刪除 ...
  • 最近在入門nodejs,正好學習到瞭如何使用nodejs進行資料庫的連接,覺得比較重要,便寫一下隨筆,簡單地記錄一下 使用在安裝好node之後,我們可以使用npm命令,在項目的根目錄,安裝nodejs中的mysql模塊 在連接資料庫之前,要先引入nodejs連接處理mysql的模塊 類似php連接m ...
  • 類型 行級觸發器: FOR EACH ROW 影響的每一行都會執行觸發器 語句級出發器 預設的模式,一句話才執行一次觸發器 觸發器不能嵌套,不能含有事務控制語句 何時觸發 Before:條件運行前 After:條件運行後 Instead of:替代觸發,作用在視圖上 創建觸發器 實例一 1.創建一個 ...
  • 學習到 oracle 的視圖的時候,瞭解到對 Oracle 中數據的記錄進行分頁處理和 Mysql 提供的 limit 來進行分頁處理大有不同,limit 是 mysql 中特有的關鍵字。 那麼在 oracle 中如何實現對記錄的分頁處理呢? 解決辦法:使用 ROWNUM 1.問題如下:查詢出成績前 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...