Hbase過濾器

来源:https://www.cnblogs.com/qinshifu/archive/2018/09/02/9575138.html
-Advertisement-
Play Games

Hbase過濾器簡介 HBase的基本API,包括增、刪、改、查等,增、刪都是相對簡單的操作,與傳統的RDBMS相比,這裡的查詢操作略顯蒼白,只能根據特性的行鍵進行查詢(Get)或者根據行鍵的範圍來查詢(Scan)。 HBase不僅提供了這些簡單的查詢,而且提供了更加高級的過濾器(Filter)來查 ...


 

Hbase過濾器簡介

 

  HBase的基本API,包括增、刪、改、查等,增、刪都是相對簡單的操作,與傳統的RDBMS相比,這裡的查詢操作略顯蒼白,只能根據特性的行鍵進行查詢(Get)或者根據行鍵的範圍來查詢(Scan)。 HBase不僅提供了這些簡單的查詢,而且提供了更加高級的過濾器(Filter)來查詢。通過這些過濾器可以在HBase中的數據的多個維度(行,列,數據版本)上進行對數據的篩選操作,也就是說過濾器最終能夠篩選的數據能夠細化到具體的一個存儲單元格上(由行鍵,列明,時間戳定位)。

  HBase過濾器的類型很多,但是可以分為兩大類:比較過濾器,專用過濾器。

 1. 比較過濾器 - 通用比較器

  比較器作為過濾器的核心組成之一,用於處理具體的比較邏輯,例如位元組級的比較,字元串級的比較等。

  • BinaryComparator

     二進位比較器,用於按字典順序比較 Byte 數據值

  • BinaryPrefixComparator

     首碼二進位比較器,按首碼比較

  • NullComparator  

     判斷給定的是否為空

  • BitComparator

          按位比較

  • RegexStringComparator

          支持正則表達式的值比較,僅支持 EQUAL 和非EQUAL

  • SubstringComparator

          判斷提供的子串是否出現在value中,不區分大小寫

    2. 比較過濾器 - 通用操作符

     HBase提供了枚舉類型的變數來表示我們常用的抽象操作符。

  • LESS   <
  • LESS_OR_EQUAL   <=
  • EQUAL   =
  • NOT_EQUAL   <>
  • GREATER_OR_EQUAL   >=
  • GREATER   >
  • NO_OP   排除所有

     3.比較過濾器 - 行健過濾器

  • RowFilter 篩選出行健匹配的所有的行

- 語法 RowFilter(操作符,比較器)

- 性能 一般來講,執行 Scan 使用 startRow/stopRow 方式比較好

- 示例代碼

new RowFilter(CompareFilter.CompareOp.EQUAL, 
    new BinaryComparator(
    Bytes.toBytes("testRowkey1")))
    篩選出行健等於testRowkey1的行
new RowFilter(
    CompareFilter.CompareOp.LESS_OR_EQUAL,
    new BinaryComparator(
    Bytes.toBytes("testRowkey20")))
    篩選出行健小於等於testRowkey20的行

 

- 調用示例

Connection connection = ConnectionFactory.createConnection(
    ConfigFactory.getInstance().getHbaseConf());
Table table = connection.getTable(TableName.valueOf(tableName));
Scan scan = new Scan();
Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL, 
    new BinaryComparator(Bytes.toBytes(rowkey)));
scan.setFilter(filter);
ResultScanner results = table.getScanner(scan);

 

   4.比較過濾器 - 列簇過濾器

- FamilyFilter 篩選出列簇匹配的數據 返回數據的單位是Cell,而不是整行數據

- 語法 FamilyFilter(操作符,比較器)

- 性能 通常在 Scan 過程中通過設定某些列族來實現該功能,而不是直接使用該過濾器

- 示例代碼

new FamilyFilter(CompareFilter.CompareOp.EQUAL, 
    new BinaryComparator(
    Bytes.toBytes("family1")))
    篩選出列簇等於family1的cell
new FamilyFilter(CompareFilter.CompareOp.LESS, 
    new BinaryComparator(Bytes.toBytes("family20")))
    篩選出列簇小於family20的cell

 

   5.比較過濾器 - 子列過濾器

- QualifierFilter 篩選出子列匹配的數據 返回數據的單位是Cell,而不是整行數據

- 語法 QualifierFilter(操作符,比較器)

- 示例代碼

new QualifierFilter(CompareOp.EQUAL, new RegexStringComparator("you."));
    篩選出子列以you開頭,不止是you,以及空的cell
new QualifierFilter(CompareOp.NOT_EQUAL, new BinaryComparator(Bytes.toBytes("column1")))
    篩選出子列不等於column1的cell

 

   6.比較過濾器 - 子列範圍過濾器

- ColumnRangeFilter 該過濾器用於獲取一個指定子列範圍內的所有Cell。

- 語法 ColumnRangeFilter(子列起始值、是否包含起始值,子列結束值,是否包含結束值)

- 性能 該過濾器可以進行高效的子列內部掃描(因為子列是已經按字典排序好的),HBase-0.9.2 版本引入該功能。

- 示例代碼

new ColumnRangeFilter(
    Bytes.toBytes("column1"), true,
    Bytes.toBytes("column10"), true)
   篩選出子列大於等於column1,小於等於column10的 所有cell

   7.比較過濾器 -列值過濾器

- ValueFilter 篩選出列值匹配的數據 返回數據的單位是Cell,而不是整行數據

- 語法 ValueFilter(操作符,比較器)

- 示例代碼

new ValueFilter(CompareFilter.CompareOp.EQUAL, new SubstringComparator("value"))
   篩選出所有列值中包含value的cell

   8.專用過濾器 - 行健首碼過濾器

- PrefixFilter 篩選出行健首碼匹配的所有的行

- 語法 PrefixFilter(行健首碼)

- 示例代碼 

new PrefixFilter(Bytes.toBytes("testRowkey"))
    篩選出行健首碼等於testRowkey的所有行

   9.專用過濾器 - 子列首碼過濾器

- ColumnPrefixFilter 篩選出包含首碼的所有子列 返回數據的單位是Cell,而不是整行數據一般來講

- 語法 ColumnPrefixFilter(首碼)

- 示例代碼

new ColumnPrefixFilter(Bytes.toBytes("column"))
    篩選出所有以column開頭子列的cellnew ColumnPrefixFilter(Bytes.toBytes("column"))
    篩選出所有以column開頭子列的cell

  10.專用過濾器 - 多子列首碼過濾器

- MultipleColumnPrefixFilter MultipleColumnPrefixFilter 與 ColumnPrefixFilter 的行為類似,但可以指定多個子列首碼

- 語法 MultipleColumnPrefixFilter(首碼byte二維數組)

- 示例代碼

byte[][] prefixes = new byte[][]{Bytes.toBytes("column 1"), Bytes.toBytes("column2")}
   new MultipleColumnPrefixFilter (prefixes)
   篩選出所有以column1和column2開頭子列的cell

 11.專用過濾器 - 列綜合過濾器

- DependentColumnFilter 該過濾器嘗試找到該列簇、子列所在的Cell。

- 語法 DependentColumnFilter(列簇、子列)

- 示例代碼

new DependentColumnFilter(
    Bytes.toBytes("family1"), Bytes.toBytes("column1"))
   篩選出所有列簇family1、子列column1的所有Cell

   12.專用過濾器 - 結構過濾器

- FilterList 該過濾器代表一個過濾器鏈 ,它可以包含一組即將應用於目標數據集的過濾器,過濾器間具有“與”和“或”關係。

- 語法

FilterList(列關係、過濾器集合)

FilterList.Operator.MUST_PASS_ ALL 關係與

FilterList.Operator.MUST_PASS_ ONE 關係或

 - 示例代碼

Connection connection = ConnectionFactory.createConnection(
    ConfigFactory.getInstance().getHbaseConf());
Table table = connection.getTable(TableName.valueOf(tableName));
Scan scan = new Scan();
Filter filter1 = new RowFilter(CompareFilter.CompareOp.EQUAL, 
    new BinaryComparator(Bytes.toBytes(rowkey)));
Filter filter2 = new DependentColumnFilter(
    Bytes.toBytes(“family1”), Bytes.toBytes(“column1”));
List<Filter> filters = new ArrayList<>(2);
filters.add(filter1);
filters.add(filter2);
FilterList filterList = new FilterList(FilterList.Operator.MUST_PASS_ALL, filters);
scan.setFilter(filterList);
ResultScanner results = table.getScanner(scan);

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、測試環境 OS version: CentOS Linux release 7.5.1804 (Core) docker cluster : master 1 + data node 4 docker version: 1.13.1 二、材料準備 1. dockerfile 文件,如下 /opt ...
  • 前言 在開始之前,請在心中默念三遍: Arch Linux 是世界上最好的發行版, 我一定能掌握她. 環境 VM ware + UEFI + 500G 虛擬磁碟 + 2G 記憶體 + 橋接網路 下載鏡像 進入這裡挑個最新的就好, https://mirrors.tuna.tsinghua.edu.cn ...
  • hbase 單機安裝部署及phoneix 單機安裝 Hbase 下載 (需先配置jdk) 解壓安裝 修改配置文件 配置文件修改 啟動 hbase 修改環境變數 環境變數配置 安裝測試 安裝phoneix 下載 解壓到目錄 將 修改 hosts文件(必須配置) 重啟habse 啟動phoneix 可能 ...
  • 最近公司新配置的win10電腦,由於測試關於windows系統上項目的安裝程式時預設使用了c盤安裝,發現安裝後的項目不是崩潰就是運行沒結果的,偶然間發現同一個安裝程式在d盤或其他非系統盤安裝則正常。很自然會懷疑這是安裝之後的項目在c盤沒有足夠的讀寫許可權的原因。果然在網上查找相關原因後發現是因為win ...
  • 這隻是我自己的隨筆博客~,用於偶爾回憶知識,可能存在一些錯誤,如有錯誤,歡迎指正~ 首先對於JDBC連接MySQL,要瞭解基本的框架結構 畫的比較爛,大約就是這樣的結構 然後看一下具體實現的 代碼:; 上面這個是通過單例模式 建立了DBUtil這樣一個類。通過這個類可以乾什麼呢?可以實現 資料庫的連 ...
  • 小菜最近用到RabbitMQ,由於之前瞭解過其他消息中間件,算是有些基礎,所以隨手從網上搜了幾篇文章,準備大概瞭解下RabbitMQ的消息模型,沒想到網上文章千篇一律,寫一大堆內容,就是說不明白到底怎麼回事,真是逼小菜寫博客… 首先說明本文只適合有消息中間件基礎的讀者,本文不會講解基礎概念,而是一針 ...
  • 摘要:下文講述使用sql腳本的方法判斷字元串為大小寫的方法分享,如下所示 實驗環境:sqlserver 2008 R2 實現思路: 將字元串轉換為大寫或小寫然後轉換為二進位編碼, 然後和源字元串做對比。 原文地址:http://www.maomao365.com/?p=7358 ...
  • 一、資料庫基礎 1、什麼是資料庫 1、資料庫(database)是保存有組織的數據的容器( 通常是一個文件或一組文件 ) 2、資料庫是一個以某種有組織的方式存儲的數據集合 註意:資料庫軟體應該稱為DBMS(資料庫管理系統)。 資料庫是通過DBMS創建和操縱的容器 2、表 表(table)是某種特定類 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...