HBase 文件讀寫過程描述_ZenDei技術網路在線

HBase 文件讀寫過程描述

-Advertisement-

HBase 數據讀寫過程描述我們熟悉的在 Hadoop 使用的文件格式有許多種，例如： Avro：用於 HDFS 數據序序列化與 Parquet：常見於 Hive 數據文件保存在 HDFS中 HFile HFile 是 HBase 使用的一種柱狀存儲文件，非常適合隨機和實時讀寫。 HFile 文件 ...

HBase 數據讀寫過程描述
我們熟悉的在 Hadoop 使用的文件格式有許多種，例如：
Avro：用於 HDFS 數據序序列化與
Parquet：常見於 Hive 數據文件保存在 HDFS中
HFile
HFile 是 HBase 使用的一種柱狀存儲文件，非常適合隨機和實時讀寫。

HFile 文件的頭部記載 FileInfo 和 Meta 這是元數據。在啟動 RegionServer 後每一個RegionServer 節點會將本地 DataNode 保存的 HFile 文件中的 FileInfo 和 Meta 載入到自身 JVM 的 memstore （元數據記憶體空間）中。
read：對數據的讀則由 memstore 檢索存儲的元數據，將 Data 塊載入到 RegionServer JVM 中的 Data 記憶體空間。現在常用的 HFile v2 只需要將需要的元數據信息載入到記憶體中即可
write：每次寫入都會在 memstore 中添加信息，而不是寫入 HFile 中，只有 memstore 存儲空間不夠時，元數據信息才會被刷回 HFile 中。
HFile 自身已經對 HBase 中存儲數據進行壓縮。
參考：http://blog.cloudera.com/blog/2012/06/hbase-io-hfile-input-output/

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Linux常用97條命令

1.ls [選項] [目錄名 | 列出相關目錄下的所有目錄和文件 -a 列出包括.a開頭的隱藏文件的所有文件 -A 通-a，但不列出"."和".." -l 列出文件的詳細信息 -c 根據ctime排序顯示 -t 根據文件修改時間排序 color[=WHEN] 用色彩辨別文件類型 WHEN 可以是'n ...
超聲波測距模塊（樹莓派）

首先來看一下這個測距模塊長什麼樣子：就是HC-SR04模塊。這個模塊有四個引腳，分別是Vcc（高電平），GND（低電平），Trig（觸發測距）以及Echo（返回測距結果）。那麼這個模塊怎麼使用呢，資料上的說明是這樣的：首先給出時序圖：從上面的步驟可以看出，我們只需要測量Echo腳為高電平的 ...
MySQL---索引

索引，是資料庫中專門用於幫助用戶快速查詢數據的一種數據結構。類似於字典中的目錄，查找字典內容時可以根據目錄查找到數據的存放位置，然後直接獲取即可。以 B-tree 形式存儲： MySQL中常見索引有：普通索引唯一索引主鍵索引組合索引 1、普通索引普通索引僅有一個功能：加速查詢 1 cre ...
spark成長之路（1）spark究竟是什麼？

今年6月畢業，來到公司前前後後各種事情折騰下來，8月中旬才入職。本以為終於可以靜下心來研究技術了，但是又把我分配到了一個幾乎不做技術的解決方案部門，導致現在寫代碼的時間都幾乎沒有了，所以只能在每天下班後留在公司研究一下自己喜歡的技術，搞得特別晚才回，身心俱疲。唉~以前天天寫代碼時覺得苦逼，現在沒得 ...
MySQL---事務、函數

事務事務用於將某些操作的多個SQL作為原子性操作，一旦有某一個出現錯誤，即可回滾到原來的狀態，從而保證資料庫數據完整性。 1 delimiter \\ 2 create PROCEDURE p1( 3 OUT p_return_code tinyint 4 ) 5 BEGIN 6 DECLARE ...
mysql 開發進階篇系列 29 資料庫二進位包安裝

概述對於二進位安裝，優點是可以安裝到任何路徑下，靈活性好，一臺伺服器可以安裝多個mysql。缺點是已經繹過編譯，性能不如源碼編譯得好，不能靈活定製編譯參數。如果用戶即不想安裝最簡單卻不夠靈活的RPM包，又不想安裝複雜費時的源碼包，那麼已編譯好的二進位包將是最好的選擇。一.步驟1：解壓glib包 ...
mysql的安裝

今天需要在本地建個資料庫,就下載安裝sql,第一次弄,遇到了一些問題,環境添加到 sql的bin目錄,要用管理員命令運行cm,cd到sql/bin的目錄,輸入 net start mysql 運行sql,可能會出現密碼錯誤,到配置文件,在[mysqld]加入skip-grant-tables 可以不 ...
一起學Hadoop——MapReduce原理

一致性Hash演算法。 Hash演算法是為了保證數據均勻的分佈，例如有3個桶，分別是0號桶，1號桶和2號桶；現在有12個球，怎麼樣才能讓12個球平均分佈到3個桶中呢？使用Hash演算法的做法是，將12個球從0開始編號，得到這樣的一個序列：0，1，2，3，4，5，6，7，8，9，10，11。將這個序列中的每 ...