從零自學Hadoop(19):HBase介紹及安裝

来源:http://www.cnblogs.com/mephisto/archive/2016/09/20/5886351.html
-Advertisement-
Play Games

上一篇,我們講述了Hive的CLI和JDBC,從編程和使用的角度進入了Hadoop生態。這裡就介紹下Hadoop DataBase,簡稱HBase。   下麵我們開始介紹HBase的介紹及安裝。 ...


閱讀目錄

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 

     上一篇,我們講述了Hive的CLI和JDBC,從編程和使用的角度進入了Hadoop生態。這裡就介紹下Hadoop DataBase,簡稱HBase。

   下麵我們開始介紹HBase的介紹及安裝。

介紹

一:定義

  HBase是一個分散式的、面向列的開源資料庫,該技術來源於 Fay Chang 所撰寫的Google論文“Bigtable:一個結構化數據的分散式存儲系統”。就像Bigtable利用了Google文件系統(File System)所提供的分散式數據存儲一樣,HBase在Hadoop之上提供了類似於Bigtable的能力。HBase是Apache的Hadoop項目的子項目。HBase不同於一般的關係資料庫,它是一個適合於非結構化數據存儲的資料庫。另一個不同的是HBase基於列的而不是基於行的模式。利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。

三:架構

 

Client

  包含訪問HBase的介面,並維護cache來加快對HBase的訪問,比如region的位置信息。

Master

  為Region server分配region

  負責Region server的負載均衡

  發現失效的Region server並重新分配其上的region

  管理用戶對table的增刪改查操作

Region Server

  Regionserver維護region,處理對這些region的IO請求

  Regionserver負責切分在運行過程中變得過大的region

Zookeeper作用

  通過選舉,保證任何時候,集群中只有一個master,Master與RegionServers 啟動時會向ZooKeeper註冊

  存貯所有Region的定址入口

  實時監控Region server的上線和下線信息。並實時通知給Master

  存儲HBase的schema和table元數據

  預設情況下,HBase 管理ZooKeeper 實例,比如, 啟動或者停止ZooKeeper
  Zookeeper的引入使得Master不再是單點故障

 Write-Ahead-Log(WAL)

  每個HRegionServer中都有一個HLog對象,HLog是一個實現Write Ahead Log的類,在每次用戶操作寫入MemStore的同時,也會寫一份數據到HLog文件中(HLog文件格式見後續),HLog文件定期會滾動出新的,並刪除舊的文件(已持久化到StoreFile中的數據)。當HRegionServer意外終止後,HMaster會通過Zookeeper感知到,HMaster首先會處理遺留的 HLog文件,將其中不同Region的Log數據進行拆分,分別放到相應region的目錄下,然後再將失效的region重新分配,領取 到這些region的HRegionServer在Load Region的過程中,會發現有歷史HLog需要處理,因此會Replay HLog中的數據到MemStore中,然後flush到StoreFiles,完成數據恢復。

HBase容錯性

Master容錯:

  Zookeeper重新選擇一個新的Master
    無Master過程中,數據讀取仍照常進行;
    無master過程中,region切分、負載均衡等無法進行;
RegionServer容錯:

  定時向Zookeeper彙報心跳,如果一旦時間內未出現心跳,Master將該RegionServer上的Region重新分配到其他RegionServer上,失效伺服器上“預寫”日誌由主伺服器進行分割並派送給新的RegionServer

Zookeeper容錯:

  Zookeeper是一個可靠地服務,一般配置3或5個Zookeeper實例
Region定位流程:

安裝

一:已安裝服務

  

二:新增服務

  

三:勾選HBase

  

四:分佈HBase相關組件

  

五:分配從節點和客戶端

  

 

六:HBase配置

  設置HBase的配置。

  

七:預覽

  安裝前預覽。

  

八:安裝,測試,啟動

  開始安裝了,我們耐心的等待。

  

八:完成

  

  

  

九:效果

  我們可以看到ambari的監控界面可以看到已經裝好的HBase  

  

  

  

十:shell命令登陸

hbase shell

  

十一:HBase UI 

  

 

  

--------------------------------------------------------------------

  到此,本章節的內容講述完畢。

系列索引

  【源】從零自學Hadoop系列索引

 

 

 

 

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 處理日期的常見情景 NSDate -> String & String -> NSDate 日期比較 日期計算(基於參考日期 +/- 一定時間) 計算日期間的差異 拆解NSDate對象(分解成year/month/day/hour/minute/second 等) NSDate相關類 NSDate ...
  • 視圖控制器是 UIViewController 類或其子類對象。每個視圖控制器都負責管理一個視圖層次結構,包括創建視圖層級結構中的視圖並處理相關用戶事件,以及將整個視圖層次結構添加到應用視窗。 創建一個程式,並將上節 JXHypnosisView 類導入到工程中。 創建 UIViewControll ...
  • 和Cocoapods相比各有利弊吧,具體對比參見: Carthage 初探:四大優勢與四大劣勢 第一步:如果沒有安裝Homebrew先安裝 打開命令終端,直接輸入以下命令回車 這樣它會自己安裝,期間會讓你輸入本機密碼 第二步:安裝Carthage 在命令終端,輸入以下命令回車 安裝完以後查看版本命令 ...
  • mysql5.x升級至mysql5.7後導入之前資料庫date出錯的解決方法! ...
  • 資料庫使用Table來存儲海量的數據,細分Table結構,數據最終存儲在Table Column中,因此,在設計Table Schema時,必須慎重選擇Table Column的Data Type,數據類型不僅決定了Column能夠存儲的數據範圍和能夠進行的操作,而且合適的數據類型還能提高查詢和修改 ...
  • 如果需要在MySQL中實現記錄不存在則insert,不存在則update操作。可以使用以下語句: 更新一個欄位: 更新多個欄位: 由於MySQL對更新為原相同值有進行優化,所以更新為原相同值時不會真正對欄位進行更新操作,不存在性能問題。 更多相關內容請訪問以下英文站點: https://theweb ...
  • 在我國的製造業,工業4.0帶來的收益主要體現在生產效率提升上。而生產效率受企業管理、製造、流程、創新等多因素的影響。如何將這些環節以數據量化、呈現成了很多企業爭先探討的主題。 ...
  • Update語句 Update 表名 set 欄位1=值1, 欄位2=值2 where 條件 練習: 把用戶名帶 ‘小’的人的密碼設置為123456@ 效果 Group by 、having: 分組查詢 having分組查詢條件 語法:SELECT A ,COUNT(B) FROM TABLE GR ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...