hbase 過濾器 rowfilter

来源:https://www.cnblogs.com/xiguage119/archive/2019/03/27/10605721.html
-Advertisement-
Play Games

HBase為篩選數據提供了一組過濾器,通過這個過濾器可以在HBase中的數據的多個維度(行,列,數據版本)上進行對數據的篩選操作,也就是說過濾器最終能夠篩選的數據能夠細化到具體的一個存儲單元格上(由行鍵,列明,時間戳定位)。通常來說,通過行鍵,值來篩選數據的應用場景較多。 1.創建測試表studne ...


HBase為篩選數據提供了一組過濾器,通過這個過濾器可以在HBase中的數據的多個維度(行,列,數據版本)上進行對數據的篩選操作,也就是說過濾器最終能夠篩選的數據能夠細化到具體的一個存儲單元格上(由行鍵,列明,時間戳定位)。通常來說,通過行鍵,值來篩選數據的應用場景較多。

 

1.創建測試表studnet1

 

Vi Student1.java

import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HBaseAdmin;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.client.Put;

public class Student1{
  public static void main(String[] args){
    HBaseConfiguration config = new HBaseConfiguration();
    config.set("hbase.zookeeper.quorum", "h201,h202,h203");   
    String tablename = new String("student1");
   try{
    HBaseAdmin admin = new HBaseAdmin(config);
    if(admin.tableExists(tablename)){
       admin.disableTable(tablename);
       admin.deleteTable(tablename);
      }
     HTableDescriptor tableDesc = new HTableDescriptor(tablename);
     tableDesc.addFamily(new HColumnDescriptor("cf1"));
          
     admin.createTable(tableDesc);
     admin.close();

      HTable table = new HTable(config, Bytes.toBytes("student1"));
      Put put1 = new Put(Bytes.toBytes("a101"));
      put1.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("zs1"));

      Put put2 = new Put(Bytes.toBytes("a102"));
      put2.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ls1"));

      Put put3 = new Put(Bytes.toBytes("a103"));
      put3.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ww1"));

      table.put(put1);
      table.put(put2);
      table.put(put3);
      table.close();
    } catch(IOException e) {
            e.printStackTrace();
        }
  }
}
  1. 使用過濾器

1.1

RowFilter:篩選出匹配的所有的行,對於這個過濾器的應用場景,是非常直觀的:使用BinaryComparator可以篩選出具有某個行鍵的行,或者通過改變比較運算符(CompareFilter.CompareOp.EQUAL)來篩選出符合某一條件的多條數據

RowFilter用於過濾row key

Operator

Description

LESS

小於

LESS_OR_EQUAL

小於等於

[EQUAL

等於

NOT_EQUAL

不等於

GREATER_OR_EQUAL

大於等於

GREATER

大於

NO_OP

排除所有

 

Comparator

Description

BinaryComparator

使用Bytes.compareTo()比較

BinaryPrefixComparator

BinaryComparator差不多,從前面開始比較

RegexStringComparator

正則表達式

SubstringComparator

把數據當成字元串,用contains()來判斷

import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.filter.RowFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.BinaryComparator;
import org.apache.hadoop.hbase.filter.CompareFilter;

public class hss1{

  public static void main(String[] args){
   HBaseConfiguration config = new HBaseConfiguration();
   config.set("hbase.zookeeper.quorum", "h201,h202,h203");

  try{
   HTable table = new HTable(config, Bytes.toBytes("student1"));
   Scan scan = new Scan();
   Filter filter1 = new RowFilter(CompareFilter.CompareOp.EQUAL,new BinaryComparator("a101".getBytes()));
   scan.setFilter(filter1);
   ResultScanner rst = table.getScanner(scan);
   for (Result r:rst){
      for (KeyValue kv : r.raw()) {
         StringBuffer s1 = new StringBuffer()
                            .append(Bytes.toString(kv.getRow())).append(":")
                             .append(Bytes.toString(kv.getFamily())).append(",")
                             .append(Bytes.toString(kv.getQualifier())).append(",")
                             .append(Bytes.toString(kv.getValue()));
        System.out.println(s1.toString());
     }
   }
    rst.close();
    table.close();
    } catch(IOException e) {
            e.printStackTrace();
        }
  }
}

1.2
PrefixFilter:篩選出具有特定首碼的行鍵的數據。這個過濾器所實現的功能其實也可以由RowFilter結合RegexStringComparator來實現,不過這裡提供了一種簡便的使用方法

import org.apache.hadoop.hbase.filter.PrefixFilter;
Filter filter2 = new PrefixFilter(Bytes.toBytes("a"));
scan.setFilter(filter2);

1.3
RegexComparator 正則過濾
import org.apache.hadoop.hbase.filter.RegexStringComparator;
Filter filter3 = new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator("^a.*"));
 scan.setFilter(filter3);

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 什麼是rowkey Hbase是一個分散式的、面向列的資料庫,它和一般關係型資料庫的最大區別是:HBase很適合於存儲非結構化的數據,還有就是它基於列的而不是基於行的模式. Hbase是採用K,V存儲的,那Rowkey就是KeyValue的Key了,Rowkey也是一段二進位碼流,最大長度為64KB ...
  • 當時從主庫通過rman備份到目前測試庫還原之後,由於備份是在備庫備份的,所以資料庫還原後狀態為readonly,standby_file_management參數為auto。首先需要通過alter database clear logfile group 日誌組;讓資料庫在磁碟創建日誌文件。出現問題 ...
  • 此篇承接上一篇的基本原理,繼續展開學習,本篇主要面向數據的使用和管理,也就是開發者常用的基礎語句,開始嘍…… >>>對整表的操作 >創建表 關鍵字 Create create table student( stu_id int primary key, stu_name varchar2(20) n ...
  • 一、一些基本定義 數據:是事物客觀存在的反映,可以用文字、符號等記錄下來的。 信息:數據+處理 經過加工處理的有用的數據。 欄位:標識實體屬性的命名單位。 記錄:欄位的有序集合,一個記錄描述一個實體。 關鍵字:唯一標識每個記錄的欄位或欄位集。 二、SQL SERVER 架構 SQL Server是基 ...
  • 網路配置、遠程連接配置: 防火牆設置: SQL Server的預設埠號是1433。 網路配置: SQLServer Configuration Manager中的客戶端協議,眾多IP中隨便選一個,比如我選了“IP10”然後IP地址改為現在使用的網路的IP地址,然後把它啟用。可以觀察到預設狀態下所有 ...
  • SQL、LINQ、Lambda 三種用法顏色註釋: SQL LinqToSql Lambda QA1、 查詢Student表中的所有記錄的Sname、Ssex和Class列。select sname,ssex,class from studentLinq: from s in Students se ...
  • 錯誤如圖: 解決方案分享如下: 第一步:卸載下圖紅框圈住的玩藝。 第二步:把SP4補丁文件解壓,找到下圖紅框圈住的玩藝: 第三步:重新運行SP4補丁安裝文件,安裝正常。 ...
  • Mysql (針對Mysql5.7版本,其他版本可能略有不同) 錯誤:1045 解決方法: 以管理員身份運行cmd(win8系統:win+x 鍵 ,再按 A鍵 ),進入Mysql安裝目錄下的bin目錄下(如下圖所示,根據自己的情況修改目錄)@:下麵還要再打開cmd視窗,為方便區別,此視窗記為‘’ c ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...