Hbase入門(二)——安裝與配置

来源:https://www.cnblogs.com/tree1123/archive/2019/09/29/11606588.html
-Advertisement-
Play Games

本文講述如何安裝,部署,啟停HBase集群,如何通過命令行對Hbase進行基本操作。 並介紹Hbase的配置文件。 在安裝前需要將所有先決條件安裝完成。 一、先決條件 1、JDK 和Hadoop一樣,Hbase需要JDK1.6或者更高的版本,所以請安裝好JDK並配置環境變數。 Hbase版本與JDK ...


file

本文講述如何安裝,部署,啟停HBase集群,如何通過命令行對Hbase進行基本操作。

並介紹Hbase的配置文件。

在安裝前需要將所有先決條件安裝完成。

file

一、先決條件

1、JDK

和Hadoop一樣,Hbase需要JDK1.6或者更高的版本,所以請安裝好JDK並配置環境變數。

Hbase版本與JDK版本

HBase Version JDK 7 JDK 8 JDK 9 (Non-LTS) JDK 10 (Non-LTS) JDK 11
2.0+ HBASE-20264 HBASE-20264 HBASE-21110
1.2+ HBASE-20264 HBASE-20264 HBASE-21110

2、Zookeeper

zookeeper是Hbase集群的協調器,負責解決HMaster的單點問題,所以必須先安裝好一個zookeeper。

3、Hadoop

集群模式下,我們需要Hadoop環境

Hadoop 版本支持

  • T = 支持
  • F = 不支持
  • N = 未測試
HBase-1.2.x, HBase-1.3.x HBase-1.4.x HBase-2.0.x HBase-2.1.x
Hadoop-2.4.x T F F F
Hadoop-2.5.x T F F F
Hadoop-2.6.0 F F F F
Hadoop-2.6.1+ T F T F
Hadoop-2.7.0 F F F F
Hadoop-2.7.1+ T T T T
Hadoop-2.8.[0-1] F F F F
Hadoop-2.8.2 N N N N
Hadoop-2.8.3+ N N T T
Hadoop-2.9.0 F F F F
Hadoop-2.9.1+ N N N N
Hadoop-3.0.[0-2] F F F F
Hadoop-3.0.3+ F F T T
Hadoop-3.1.0 F F F F
Hadoop-3.1.1+ F F T T

二、安裝與部署

Hbase有兩種運行模式,單機模式和分散式模式。

1、單機模式

下載

首先在這裡下載Hbase的一個穩定版本,https://www.apache.org/dyn/closer.lua/hbase/

建議點擊頂部鏈接,進入 HBase Releases 點擊 stable 的文件夾,然後下載將以 tar.gz 結尾的二進位文件到本地。暫時不要下載以 src.tar.gz 結尾的文件。

file

解壓

進入到那個要解壓的目錄

$ tar xzvf hbase-1.3.5-bin.tar.gz
$ cd hbase-1.3.5/
JAVA_HOME

在啟動 HBase 之前,您需要設置JAVA_HOME環境變數。您可以通過操作系統的常用設置來設置變數,HBase 也提供了一個中心機制 conf/hbase-env.sh。編輯此文件,取消註釋以JAVA_HOME開頭的行,並將其設置為適合您的操作系統的路徑。

JAVA_HOME=/usr
hbase-site.xml

編輯 HBase 主配置文件 conf/hbase-site.xml.

您需要在本地文件系統上指定 HBase 和 ZooKeeper 數據存儲目錄.

<configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///home/testuser/hbase</value>
  </property>
  <property>
    <name>hbase.zookeeper.property.dataDir</name>
    <value>/home/testuser/zookeeper</value>
  </property>
  <property>
    <name>hbase.unsafe.stream.capability.enforce</name>
    <value>false</value>
    <description>
      Controls whether HBase will check for stream capabilities (hflush/hsync).

      Disable this if you intend to run on LocalFileSystem, denoted by a rootdir
      with the 'file://' scheme, but be mindful of the NOTE below.

      WARNING: Setting this to false blinds you to potential data loss and
      inconsistent system state in the event of process and/or node failures. If
      HBase is complaining of an inability to use hsync or hflush it's most
      likely not a false positive.
    </description>
  </property>
</configuration>
啟停

bin/start-hbase.sh 為啟動 HBase

bin/start-hbase.sh為停止 HBase

可以使用 jps 確認 HMaster 和 HRegionServer 進程是否開啟關閉。

2、集群模式

2.1 偽分散式模式

偽分佈模式意味著 HBase 仍然在單個主機上完全運行,但是每個 HBase 守護進程(HMaster,HRegionServer 和 ZooKeeper)作為一個單獨的進程運行.

使用集群模式前,要保證HDFS可以正常運行。

hbase-site.xml

編輯 HBase 主配置文件 conf/hbase-site.xml.

需要將分散式模式開啟 指定hdfs的URI

<property>
  <name>hbase.cluster.distributed</name>
  <value>true</value>
</property>

<property>
  <name>hbase.rootdir</name>
  <value>hdfs://localhost:8020/hbase</value>
</property>

使用 bin/start-hbase.sh 啟動 HBase. 如果您的系統配置正確,該jps命令應顯示 HMaster 和 HRegionServer 進程正在運行。

啟動和停止備份 HBase 主(HMaster)伺服器

你可以啟動最多 9 個備份 HMaster 伺服器,這個伺服器總共有 10 個 HMaster 計算主伺服器。

$ ./bin/local-master-backup.sh start 2 3 5

啟動和停止其他 RegionServers

$ .bin/local-regionservers.sh start 2 3 4 5

2.2 完全分散式

實際上,您需要一個完全分散式的配置來全面測試 HBase,並將其用於實際場景中。在分散式配置中,集群包含多個節點,每個節點運行一個或多個 HBase 守護進程。這些包括主要和備份主實例,多個 ZooKeeper 節點和多個 RegionServer 節點。

架構如下:

Node Name Master ZooKeeper RegionServer
node-a.example.com yes yes no
node-b.example.com backup yes yes
node-c.example.com no yes yes

要保證節點有通訊許可權,比如配置ssh免密和防火牆許可權,並將zookeeper配置好啟動。

將Hbase下載並解壓,將配置文件同步到各個機器上。

啟動集群
$ bin/start-hbase.sh
node-c.example.com: starting zookeeper, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-zookeeper-node-c.example.com.out
node-a.example.com: starting zookeeper, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-zookeeper-node-a.example.com.out
node-b.example.com: starting zookeeper, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-zookeeper-node-b.example.com.out
starting master, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-master-node-a.example.com.out
node-c.example.com: starting regionserver, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-regionserver-node-c.example.com.out
node-b.example.com: starting regionserver, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-regionserver-node-b.example.com.out
node-b.example.com: starting master, logging to /home/hbuser/hbase-0.98.3-hadoop2/bin/../logs/hbase-hbuser-master-nodeb.example.com.out

3、Web UI

在 HBase 0.98.x 以上, HBase Web UI 的埠從主節點的 60010 和 RegionServer 的 60030 變化為 16010 和 16030

在Hbase啟動以後可以通過頁面查看。

file

三、Hbase Shell

在 HBase 安裝目錄 bin/ 目錄下使用hbase shell命令連接正在運行的 HBase 實例。

$ ./bin/hbase shell
hbase(main):001:0>
預覽 HBase Shell 的幫助文本

輸入help並回車, 可以看到 HBase Shell 的基本信息和一些示例命令.

創建表

使用 create創建一個表 必須指定一個表名和列族名

hbase(main):001:0> create 'test', 'cf'
0 row(s) in 0.4170 seconds

=> Hbase::Table - test
表信息

使用 list 查看存在表

hbase(main):002:0> list 'test'
TABLE
test
1 row(s) in 0.0180 seconds

=> ["test"]
使用 describe 查看表細節及配置
hbase(main):003:0> describe 'test'
Table test is ENABLED
test
COLUMN FAMILIES DESCRIPTION
{NAME => 'cf', VERSIONS => '1', EVICT_BLOCKS_ON_CLOSE => 'false', NEW_VERSION_BEHAVIOR => 'false', KEEP_DELETED_CELLS => 'FALSE', CACHE_DATA_ON_WRITE =>
'false', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', MIN_VERSIONS => '0', REPLICATION_SCOPE => '0', BLOOMFILTER => 'ROW', CACHE_INDEX_ON_WRITE => 'f
alse', IN_MEMORY => 'false', CACHE_BLOOMS_ON_WRITE => 'false', PREFETCH_BLOCKS_ON_OPEN => 'false', COMPRESSION => 'NONE', BLOCKCACHE => 'true', BLOCKSIZE
 => '65536'}
1 row(s)
Took 0.9998 seconds
插入數據

使用 put 插入數據

hbase(main):003:0> put 'test', 'row1', 'cf:a', 'value1'
0 row(s) in 0.0850 seconds

hbase(main):004:0> put 'test', 'row2', 'cf:b', 'value2'
0 row(s) in 0.0110 seconds

hbase(main):005:0> put 'test', 'row3', 'cf:c', 'value3'
0 row(s) in 0.0100 seconds
掃描全部數據

從 HBase 獲取數據的途徑之一就是 scan 。使用 scan 命令掃描表數據。你可以對掃描做限制。

hbase(main):006:0> scan 'test'
ROW                                      COLUMN+CELL
 row1                                    column=cf:a, timestamp=1421762485768, value=value1
 row2                                    column=cf:b, timestamp=1421762491785, value=value2
 row3                                    column=cf:c, timestamp=1421762496210, value=value3
3 row(s) in 0.0230 seconds
獲取一條數據

使用 get 命令一次獲取一條數據

hbase(main):007:0> get 'test', 'row1'
COLUMN                                   CELL
 cf:a                                    timestamp=1421762485768, value=value1
1 row(s) in 0.0350 seconds
禁用表

使用 disable 命令禁用表

hbase(main):008:0> disable 'test'
0 row(s) in 1.1820 seconds

hbase(main):009:0> enable 'test'
0 row(s) in 0.1770 seconds

使用 enable 命令啟用表

hbase(main):010:0> disable 'test'
0 row(s) in 1.1820 seconds
刪除表
hbase(main):011:0> drop 'test'
0 row(s) in 0.1370 seconds
退出 HBase Shell

使用quit命令退出命令行並從集群斷開連接。

四、配置文件詳解

Apache HBase 使用與 Apache Hadoop 相同的配置系統。所有配置文件都位於 conf/ 目錄中,需要保持群集中每個節點的同步。

backup-masters
預設情況下不存在。這是一個純文本文件,其中列出了主伺服器應在其上啟動備份主進程的主機,每行一臺主機。
hadoop-metrics2-hbase.properties
用於連接 HBase Hadoop 的 Metrics2 框架。預設情況下只包含註釋出的示例。
hbase-env.cmd and hbase-env.sh
用於 Windows 和 Linux/Unix 環境的腳本,以設置 HBase 的工作環境,包括 Java、Java 選項和其他環境變數的位置。該文件包含許多註釋示例來提供指導。
hbase-policy.xml
RPC 伺服器使用預設策略配置文件對客戶端請求進行授權決策。僅在啟用 HBase安全模式下使用。
hbase-site.xml
主要的 HBase 配置文件。該文件指定覆蓋 HBase 的預設配置的配置選項。您可以在 docs/hbase-default.xml 中查看(但不要編輯)預設配置文件。您還可以在 HBase Web UI 的 HBase 配置選項卡中查看群集的整個有效配置(預設和覆蓋)。
log4j.properties
通過log4j進行 HBase 日誌記錄的配置文件。
regionservers
包含應該在 HBase 集群中運行 RegionServer 的主機列表的純文本文件。預設情況下,這個文件包含單個條目localhostt。它應該包含主機名或 IP 地址列表,每行一個,如果集群中的每個節點將在其localhost介面上運行 RegionServer 的話,則只應包含localhost

更多實時計算,Hbase,Flink,Kafka等相關技術博文,歡迎關註實時流式計算

file


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前面的前奏已經分析介紹了建立內核頁表相關變數的設置準備,接下來轉入正題分析內核頁表的建立。 建立內核頁表的關鍵函數init_mem_mapping(): init_mem_mapping()裡面關鍵操作有三個split_mem_range()、kernel_physical_mapping_init ...
  • # 安裝適用於arm64位的nodejs runtime v10.16.3 mkdir /runtimes cd /runtimes wget https://nodejs.org/dist/v10.16.3/node-v10.16.3-linux-arm64.tar.xz tar -xvJf no... ...
  • # 以下示例適用於x64位runtime v3.0.0 mkdir /runtimes cd /runtimes wget https://download.visualstudio.microsoft.com/download/pr/b0c44e05-b7a1-4221-94ec-a0c0d3a1... ...
  • 背景 歸檔的表在源庫和目標庫都要存在 pt archiver歸檔表的場景有:不刪原表數據,非批量插入目標庫;不刪原表數據,批量插入目標庫;非批量刪除原表數據,非批量插入目標庫;批量刪除原表數據,批量插入目標庫 版本 pt archiver version pt archiver 3.0.12 sel ...
  • hadoop2.7.2 MapReduce Job提交源碼及切片源碼分析 1. 首先從 函數進入 2. 進入 方法 3. 進入 方法 MapReduce作業提交時連接集群通過Job的Connect方法實現,它實際上是構造集群Cluster實例cluster cluster是連接MapReduce集群 ...
  • 移動支付的快速發展,讓我們擺脫了對現金的依賴,即使我們出門忘記帶現金,那也沒關係,我們照樣可以通過手機來完成支付。現如今無論是大商場、還是水果攤都支持二維碼付款,這也就意味著智慧化的生活正在一步步地向我們靠近。 就在二維碼支付“大局已定”的時候,一種新型的支付方式“刷臉支付”開始浮現,它目前已經應用 ...
  • 原文:https://blog.csdn.net/sqlquan/article/details/82699237 做個例子描述吧,也許更易於理解。 準備: 1.建表 create table INTERVAL_TEST (   t_id     I ...
  • 上一篇講述了solr的安裝啟動過程,這一篇講述如何導入數據到solr里。 一、準備數據 1.1 學生相關表 創建學生表、學生專業關聯表、專業表、學生行業關聯表、行業表、基礎信息表,並創建一條小白的信息。由於navicat收費,所以這裡利用HeidiSQL連接本地的MySql建立表。 1.2查詢數據 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...