編譯Hadoop

来源:http://www.cnblogs.com/one--way/archive/2016/10/12/5954506.html
-Advertisement-
Play Games

Apache Hadoop 生態圈軟體下載地址:http://archive.apache.org/dist/hadoop/hadoop下載地址 http://archive.apache.org/dist/hadoop/common 安裝環境 虛擬機中的 CentOS 64位 需要安裝軟體: jd ...


Apache Hadoop 生態圈軟體下載地址:http://archive.apache.org/dist/hadoop/
hadoop下載地址 http://archive.apache.org/dist/hadoop/common

 

安裝環境 虛擬機中的 CentOS 64位

 

需要安裝軟體:

jdk: jdk-7u45-linux-x64.rpm hadoop:hadoop-2.7.2-src.tar.gz maven:apache-maven-3.0.5-bin.tar.gz protobuf:protobuf-2.5.0.tar.gz   在hadoop目錄下有個BUILDING.txt文件,編譯源碼需要準備的軟體,及編譯方法進行了說明,可參考使用  
Requirements:

* Unix System
* JDK 1.7+
* Maven 3.0 or later
* Findbugs 1.3.9 (if running findbugs)
* ProtocolBuffer 2.5.0
* CMake 2.6 or newer (if compiling native code), must be 3.0 or newer on Mac
* Zlib devel (if compiling native code)
* openssl devel ( if compiling native hadoop-pipes and to get the best HDFS encryption performance )
* Jansson C XML parsing library ( if compiling libwebhdfs )
* Linux FUSE (Filesystem in Userspace) version 2.6 or above ( if compiling fuse_dfs )
* Internet connection for first build (to fetch all Maven and Hadoop dependencies)

 

1.下載Hadoop

wget  http://apache.opencas.org/hadoop/common/hadoop-2.7.2/hadoop-2.7.2-src.tar.gz tar -zxvf  hadoop-2.7.2-src.tar.gz  

2.安裝JDK

sudo yum install jdk-7u45-linux-x64.rpm  查看jdk安裝位置:   which java /usr/java/jdk1.7.0_45/bin/java  添加jdk到環境變數(~/.bash_profile):   export JAVA_HOME=/usr/java/jdk1.7.0_45 export PATH=.:$JAVA_HOME/bin:$PATH  驗證:   java -version java version "1.7.0_45" Java(TM) SE Runtime Environment (build 1.7.0_45-b18) Java HotSpot(TM) 64-Bit Server VM (build 24.45-b08, mixed mode) 

 

3、安裝maven

wgethttp://apache.fayea.com/maven/maven-3/3.0.5/binaries/apache-maven-3.0.5-bin.tar.gz tar -xzvf apache-maven-3.0.5-bin.tar.gz    添加maven到環境變數(~/.bash_profile): export MAVEN_HOME=/home/hadoop/app/apache-maven-3.0.5 export PATH=.:$MAVEN_HOME/bin:$PATH    驗證: mvn -version Apache Maven 3.0.5 (r01de14724cdef164cd33c7c8c2fe155faf9602da; 2013-02-19 05:51:28-0800) Maven home: /home/hadoop/app/apache-maven-3.0.5 Java version: 1.7.0_45, vendor: Oracle Corporation Java home: /usr/java/jdk1.7.0_45/jre Default locale: en_US, platform encoding: UTF-8 OS name: "linux", version: "2.6.32-358.el6.x86_64", arch: "amd64", family: "unix"    如果設置代理,需要修改maven配置文件。 <proxy>       <id>optional</id>       <active>true</active>       <protocol>http</protocol>       <host>x.x.x.x</host>       <port>8080</port> </proxy>   下載失敗可以換鏡像 <mirror>    <id>CN</id>    <name>OSChina Central</name>                                                                                       <url>http://maven.oschina.net/content/groups/public/</url>    <mirrorOf>central</mirrorOf>  </mirror>

 

4、安裝protobuf

  protobuf的官方地址貌似上不了,自行下載protobuf安裝包;為了編譯安裝protobuf,需要先gcc/gcc-c++/make   sudo apt-get install gcc sudo apt-get install c++ sudo apt-get install cmake sudo apt-get install gcc-c++   tar -zvxf protobuf-2.5.0.tar.gz  cd protobuf-2.5.0 ./configure --prefix=/usr/local/protoc/  sudo make sudo make install  添加protobuf到環境變數(~/.bash_profile):   export PATH=.:/usr/local/protoc/bin:$PATH  驗證:   protoc --version libprotoc 2.5.0  

5、安裝其他依賴

sudo yum install cmake sudo yum install openssl-devel sudo yum install ncurses-devel 

 

6、編譯hadoop源代碼

cd ~/app/hadoop-2.7.2-src  mvn package -DskipTests -Pdist,native    編譯後的代碼在hadoop-2.7.2-src/hadoop-dist/target/hadoop-2.7.2下  

問題:

一、編譯過程中下載jar失敗。
java.net.UnknownHostException: archive.apache.org
解決方式: 1.手動下載放到如下目錄: hadoop-common-project\hadoop-kms\downloads hadoop-hdfs-project\hadoop-hdfs-httpfs\downloads 2.刪除配置文件中的下載步驟: hadoop-common-project\hadoop-kms\target\antrun\build-main.xml <mkdir dir="downloads"/>   <get dest="downloads/apache-tomcat-6.0.41.tar.gz" skipexisting="true" verbose="true" src="http://archive.apache.org/dist/tomcat/tomcat-6/v6.0.41/bin/apache-tomcat-6.0.41.tar.gz"/>   二、Maven編譯出現“java.lang.OutOfMemoryError: Java heap space” 解決方式: .profile 中添加 export MAVEN_OPTS='-Xms256m -Xmx1024m'     三、編譯出現 分配記憶體空間失敗 擴大虛擬機記憶體   四、CMake Error     Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the sudo apt-get install libssl-dev
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 才參加工作不久,很多代碼習慣還沒養成,昨天按要求寫的資料庫基本增刪改查操作,在使用這些方法的時候,雖然能實現功能,但是效率低下,還可能產生記憶體問題,今天被項目經理一頓教育,在此記錄學到的教訓。 mybatis中重覆的代碼使用sql和include標簽進行封裝和調用 資料庫操作使用的是mybatis框 ...
  • 在進行ETL開發時,數據類型(Data Type)是最基礎的,但也容易被忽略,樓主使用的SQL Server 版本是2012,用此博文記錄,常用的SSIS數據類型和TSQL數據類型的映射關係。SSIS的數據類型,主要是指數據流(Data Flow)數據類型和變數(Variable)數據類型。 當數據 ...
  • 無意睹到一篇舊文檔 SR0008:考慮使用 SCOPE_IDENTITY 代替 @@IDENTITY :https://msdn.microsoft.com/zh-cn/library/dd172121(v=vs.100).aspx 日常開發,我們如果在插入記錄的同時需要返回插入的IdentityI ...
  • 如果你初識MySql的話,那麼這些語法糖你有必要知道。 1.Sql創建資料庫 2.Sql創建數據表 3.創建存儲過程 4.關於批量更新和插入數據到mysql ...
  • 最近筆試面試特別多的都問到了資料庫索引,由於之前並沒有單獨做系統的複習,導致許多關於索引的知識點記憶的很模糊,今天整理下相關筆記(並沒有深挖,對於初學者還是可以看看的),僅供參考。 什麼是索引 資料庫索引好比是一本書前面的目錄,能加快資料庫的查詢速度。 例如這樣一個查詢:select * from ...
  • 簡介 對於資料庫運維人員來說創建session或者查詢時產生問題是常規情況,下麵介紹一種很有效且不藉助第三方工具的方式來解決類似問題。 最近開始接觸運維工作,所以自己總結一些方案便於不懂資料庫的同事解決一些不太緊要的資料庫問題。類似方法很多理論也很多,我就不做深究,就是簡單寫一個方案,便於菜鳥使用的 ...
  • 1. 資料庫文件被其他線程覆蓋或刪除在文件描述符關掉以後,繼續使用這個文件描述符訪問打開文件,獲取文件描述符fd(其實是一個整形)關閉文件打開sqlite文件,獲取文件描述符(碰巧也是)fd另一個線程繼續使用fd,寫文件sqlite文件被損壞在事務進行過程中,進行資料庫備份或恢覆在資料庫事務過程中,... ...
  • 這是 《MySQL 必知必會》 的讀書總結。也是自己整理的常用操作的參考手冊。 使用 MySQL 連接到 MySQL shell>mysql -u root -p Enter password:******顯示資料庫 mysql>SHOW DATABASES;選擇資料庫 mysql>USE myte... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...