hbase 過濾器 rowfilter_ZenDei技術網路在線

hbase 過濾器 rowfilter

-Advertisement-

HBase為篩選數據提供了一組過濾器，通過這個過濾器可以在HBase中的數據的多個維度（行，列，數據版本）上進行對數據的篩選操作，也就是說過濾器最終能夠篩選的數據能夠細化到具體的一個存儲單元格上（由行鍵，列明，時間戳定位）。通常來說，通過行鍵，值來篩選數據的應用場景較多。 1.創建測試表studne ...

HBase為篩選數據提供了一組過濾器，通過這個過濾器可以在HBase中的數據的多個維度（行，列，數據版本）上進行對數據的篩選操作，也就是說過濾器最終能夠篩選的數據能夠細化到具體的一個存儲單元格上（由行鍵，列明，時間戳定位）。通常來說，通過行鍵，值來篩選數據的應用場景較多。

1.創建測試表studnet1

Vi Student1.java

import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HBaseAdmin;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.client.Put;

public class Student1{
  public static void main(String[] args){
    HBaseConfiguration config = new HBaseConfiguration();
    config.set("hbase.zookeeper.quorum", "h201,h202,h203");   
    String tablename = new String("student1");
   try{
    HBaseAdmin admin = new HBaseAdmin(config);
    if(admin.tableExists(tablename)){
       admin.disableTable(tablename);
       admin.deleteTable(tablename);
      }
     HTableDescriptor tableDesc = new HTableDescriptor(tablename);
     tableDesc.addFamily(new HColumnDescriptor("cf1"));
          
     admin.createTable(tableDesc);
     admin.close();

      HTable table = new HTable(config, Bytes.toBytes("student1"));
      Put put1 = new Put(Bytes.toBytes("a101"));
      put1.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("zs1"));

      Put put2 = new Put(Bytes.toBytes("a102"));
      put2.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ls1"));

      Put put3 = new Put(Bytes.toBytes("a103"));
      put3.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ww1"));

      table.put(put1);
      table.put(put2);
      table.put(put3);
      table.close();
    } catch(IOException e) {
            e.printStackTrace();
        }
  }
}

使用過濾器

1.1

RowFilter：篩選出匹配的所有的行，對於這個過濾器的應用場景，是非常直觀的：使用BinaryComparator可以篩選出具有某個行鍵的行，或者通過改變比較運算符（CompareFilter.CompareOp.EQUAL）來篩選出符合某一條件的多條數據

RowFilter用於過濾row key

Operator	Description
LESS	小於
LESS_OR_EQUAL	小於等於
[EQUAL	等於
NOT_EQUAL	不等於
GREATER_OR_EQUAL	大於等於
GREATER	大於
NO_OP	排除所有

Comparator	Description
BinaryComparator	使用Bytes.compareTo()比較
BinaryPrefixComparator	和BinaryComparator差不多，從前面開始比較
RegexStringComparator	正則表達式
SubstringComparator	把數據當成字元串，用contains()來判斷

import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.filter.RowFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.BinaryComparator;
import org.apache.hadoop.hbase.filter.CompareFilter;

public class hss1{

  public static void main(String[] args){
   HBaseConfiguration config = new HBaseConfiguration();
   config.set("hbase.zookeeper.quorum", "h201,h202,h203");

  try{
   HTable table = new HTable(config, Bytes.toBytes("student1"));
   Scan scan = new Scan();
   Filter filter1 = new RowFilter(CompareFilter.CompareOp.EQUAL,new BinaryComparator("a101".getBytes()));
   scan.setFilter(filter1);
   ResultScanner rst = table.getScanner(scan);
   for (Result r:rst){
      for (KeyValue kv : r.raw()) {
         StringBuffer s1 = new StringBuffer()
                            .append(Bytes.toString(kv.getRow())).append(":")
                             .append(Bytes.toString(kv.getFamily())).append(",")
                             .append(Bytes.toString(kv.getQualifier())).append(",")
                             .append(Bytes.toString(kv.getValue()));
        System.out.println(s1.toString());
     }
   }
    rst.close();
    table.close();
    } catch(IOException e) {
            e.printStackTrace();
        }
  }
}

1.2
PrefixFilter：篩選出具有特定首碼的行鍵的數據。這個過濾器所實現的功能其實也可以由RowFilter結合RegexStringComparator來實現，不過這裡提供了一種簡便的使用方法

import org.apache.hadoop.hbase.filter.PrefixFilter;
Filter filter2 = new PrefixFilter(Bytes.toBytes("a"));
scan.setFilter(filter2);

1.3
RegexComparator 正則過濾
import org.apache.hadoop.hbase.filter.RegexStringComparator;
Filter filter3 = new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator("^a.*"));
scan.setFilter(filter3);

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

hbase rowkey 的設計

什麼是rowkey Hbase是一個分散式的、面向列的資料庫，它和一般關係型資料庫的最大區別是：HBase很適合於存儲非結構化的數據，還有就是它基於列的而不是基於行的模式. Hbase是採用K,V存儲的,那Rowkey就是KeyValue的Key了,Rowkey也是一段二進位碼流，最大長度為64KB ...
記一次異機rman還原後的操作

當時從主庫通過rman備份到目前測試庫還原之後，由於備份是在備庫備份的，所以資料庫還原後狀態為readonly，standby_file_management參數為auto。首先需要通過alter database clear logfile group 日誌組;讓資料庫在磁碟創建日誌文件。出現問題 ...
Oracle資料庫操作---基礎使用(二)

此篇承接上一篇的基本原理,繼續展開學習,本篇主要面向數據的使用和管理，也就是開發者常用的基礎語句，開始嘍…… >>>對整表的操作 >創建表關鍵字 Create create table student( stu_id int primary key, stu_name varchar2(20) n ...
SQL SERVER資料庫的簡單介紹

一、一些基本定義數據：是事物客觀存在的反映，可以用文字、符號等記錄下來的。信息：數據+處理經過加工處理的有用的數據。欄位：標識實體屬性的命名單位。記錄：欄位的有序集合，一個記錄描述一個實體。關鍵字：唯一標識每個記錄的欄位或欄位集。二、SQL SERVER 架構 SQL Server是基 ...
SQL學習（1）初學實驗：SQL Server基本配置及基本操作

網路配置、遠程連接配置：防火牆設置： SQL Server的預設埠號是1433。網路配置： SQLServer Configuration Manager中的客戶端協議，眾多IP中隨便選一個，比如我選了“IP10”然後IP地址改為現在使用的網路的IP地址，然後把它啟用。可以觀察到預設狀態下所有 ...
SQL、LINQ、Lambda 三種用法(轉)

SQL、LINQ、Lambda 三種用法顏色註釋： SQL LinqToSql Lambda QA1、查詢Student表中的所有記錄的Sname、Ssex和Class列。select sname,ssex,class from studentLinq: from s in Students se ...
SQL2005打SP4補丁報錯：無法安裝Windows Installer MSP文件解決方案

錯誤如圖：解決方案分享如下：第一步：卸載下圖紅框圈住的玩藝。第二步：把SP4補丁文件解壓，找到下圖紅框圈住的玩藝：第三步：重新運行SP4補丁安裝文件，安裝正常。 ...
Mysql5.7登錄錯誤1045和1130的解決方法，親測有用，希望能幫助到你們。

Mysql (針對Mysql5.7版本，其他版本可能略有不同) 錯誤：1045 解決方法：以管理員身份運行cmd（win8系統：win+x 鍵，再按 A鍵），進入Mysql安裝目錄下的bin目錄下（如下圖所示，根據自己的情況修改目錄）@：下麵還要再打開cmd視窗，為方便區別，此視窗記為‘’ c ...