HIVE架構_ZenDei技術網路在線

HIVE架構

-Advertisement-

UI：用於提交查詢的客戶端，hive自帶有CLI(command line)，現在推薦使用beeline DRIVER： 1.用於接收客戶端提交的SQL，並實現了session控制 2.並提供了jdbc/odbc的fetch和execute功能 COMPILER：編譯器，負責解析SQL，並從ME ...

UI：

用於提交查詢的客戶端，hive自帶有CLI(command line)，現在推薦使用beeline

DRIVER：

1.用於接收客戶端提交的SQL，並實現了session控制

2.並提供了jdbc/odbc的fetch和execute功能

COMPILER：

編譯器，負責解析SQL，並從METASTORE那裡獲取元數據生成執行計劃，然後發給DRIVER

執行計劃就是一個DAG(有向無環圖)

組件：

1.Parser：將查詢語句轉變成一個parse tree

2.Semantic Analyser：將parse tree變成一個內部的查詢表示(依然是基於查詢塊，而不是operator tree)。同時在這一步也會做語法檢查，類型檢查和類型隱式轉換

3.Logical Plan Generator：將內部的查詢表示轉變成一個邏輯計劃(包含一個operator tree)，一些operator是關係代數的filter，join等，另一些是hive特定的，用於將邏輯計劃變成一系列的map/reduce job,比如reduceSink operator(出現在map-reduce邊界)；這一步Optimizer也會對查詢進行優化,比如map端聚合等

4.Query Plan Genertor：將邏輯計劃轉換成一系列的map-reduce tasks.做法是，通過對operator tree遞歸遍歷，然後拆分成一系列的map/reduce task，然後提交到hadoop進行執行

METASTORE

元數據存儲，存儲數倉中的DATABASE,TABLE,PARTITION,COLUMN,SERIALIZERS和DESERIALIZERS

目的：提供數據抽象和數據發現，如果數據抽象，每次查詢的時候，用戶都需要提供數據格式，extractors和loaders。metasore的數據在表創建或重建都會更新，類似於傳統數據倉庫(這些信息存在於配置的資料庫中，一般是mysql)

EXECUTION ENGINE

DRIVER將執行計劃發給ENGINE,然後ENGINE與底層交互獲取結果後，返回給DRIVER。DRIVER再將數據發送給客戶端

這一個ENGINE設計的挺好的，以前是MAPREDUCE,現在可以是TEZ，spark,以後是否在出現新的框架，誰又說得準？！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Newtonsoft 六個超簡單又實用的特性，值得一試【下篇】

一：講故事上一篇介紹的 6 個特性從園子里的反饋來看效果不錯，那這一篇就再帶來 6 個特性同大家一起欣賞。二：特性分析 1. 像弱類型語言一樣解析 json 大家都知道弱類型的語言有很多，如: nodejs，python，php，它們有一個🐮👃的地方就是處理json，不需要像強類型語言那 ...
一文告訴你Linux如何配置KVM虛擬化--安裝篇

KVM全稱"Kernel-based Virtual Machine",即基於內核的虛擬機，在linux內啟用kvm需要硬體，內核和軟體(qemu)支持，這篇文章教你如何配置並安裝KVM虛擬機. 檢查硬體和系統的相容性檢查硬體虛擬化:LC_ALL=C lscpu | grep Virtualiza ...
Linux下cp的命令解釋

今天帶領各位看官，學習一下cp的命令，一般看到cp命令會一個反應是拷貝，相當於windows下的複製。其實在真正的實際應用中，避免“XXX攻城獅”們在修改重要文件出現改壞文件的情況，所以就需要cp命令用來先備份文件了。詳細情況且細細體會。(看的再多也不要忘記動手練習一下喲！o(^▽^)o) cp ...
線性表的鏈式存儲--單鏈表

Java之線性表的鏈式存儲——單鏈表我們都知道，線性表的存儲結構分為兩種，順序存儲結構和鏈式存儲結構，線性表的分類可以參考下圖來學習記憶。今天我們主要來學習一下鏈式存儲結構。一、鏈式存儲介紹 "鏈式存儲結構，地址可以連續也可以不連續的存儲單元存儲數據元素"——來自定義。其實，你可以想象這樣一個 ...
AppleScript 實現簡訊自動轉發

背景：這段時間某位同事需要頻繁登錄我的賬號，並且要驗證手機驗證碼，每次都需要我手動將驗證碼轉發給他，覺得非常的麻煩，便想看一下有沒有什麼能夠解放雙手的辦法，然後發現了AppleScript這麼一個非常好用的東西：）所需配置 Mac 電腦：既然是使用AppleScript，那麼一臺MAC電腦自然是 ...
最詳細教學--win10 + frp + rdpwrap + 阿裡雲伺服器 --實現win10 多用戶同時遠程登錄內網機

使用win10 專業版 + frp + RDPwrap + 阿裡雲伺服器的組合實現win10 多用戶同時遠程登錄內網機。使用frp 做內網穿透，將內網機的指定埠暴露在外網，通過ip+port 來實現遠程登陸。再使用rdpwrap 來破解win10 不能同時多用戶登陸的問題。 ...
觸發器 trigger

觸發器是被指定關聯到一個表的數據對象，它不需要調用，當對一個表的特別事件出現時，它就被激活。觸發器的代碼也是由SQL語句組成的，因此用在存儲過程中的語句也可以用再觸發器的定義中。觸發器是一類特殊的存儲過程，與表的關係密切，用於保護表中的數據，當有操作影響到觸發器保護的數據時，觸發器將自動執行。（1 ...
[mysql]錯誤解決之"Failed to start MySQL Server"

無論你安裝過多少次mysql，仍然會出現各種各樣的錯誤，既然出現了，就想辦法解決它：OK！接下來教大家怎樣查看錯誤日誌，去解決懵逼的代碼錯誤。錯誤：經過一些列的重啟操作、查看錯誤詳情，並不能精準找到錯誤原因，經過一番百度，發現有說磁碟空間不足的、有說需要刪除var/lib/mysql的無論 ...