廣義上來說,Hadoop大數據平臺也可以看做是新一代的數據倉庫系統, 它也具有很多現代數據倉庫的特征,也被企業所廣泛使用。因為MPP架構的可擴展性,基於MPP的數據倉庫系統有時候也被劃分到大數據平臺類產品。 但是數據倉庫和Hadoop平臺還是有很多顯著的不同。針對不同的使用場景其發揮的作用和給用戶帶 ...
廣義上來說,Hadoop大數據平臺也可以看做是新一代的數據倉庫系統, 它也具有很多現代數據倉庫的特征,也被企業所廣泛使用。因為MPP架構的可擴展性,基於MPP的數據倉庫系統有時候也被劃分到大數據平臺類產品。
但是數據倉庫和Hadoop平臺還是有很多顯著的不同。針對不同的使用場景其發揮的作用和給用戶帶來的體驗也不經相同。用戶可以根據下表簡單判斷什麼場景更適合用什麼樣的產品。
特性 |
Hadoop |
Data Warehouse |
計算節點數 |
可到數千個 |
一般在128個以內 |
數據量 |
支持大於10PB |
一般不大於5PB |
數據類型 |
關係型,半關係型,無結構化,語音,圖像,視頻 |
關係型 |
時延 |
中/高 |
低 |
應用生態 |
創新型/人工智慧 |
傳統資料庫型/BI類 |
應用開發介面 |
SQL,MR,豐富的編程語言介面 |
標準資料庫SQL |
可擴展性 |
無窮的可能,完整的編程介面 |
有限擴展能力,主要通過UDF支持 |
事務支持 |
有限 |
完整 |
數據倉庫和Hadoop平臺互為補充,立足於滿足客戶在不同使用場景下的業務需求。公有雲數據倉庫服務DWS能夠無縫地接入到公有雲Hadoop平臺MRS服務上,支持SQL-over-Hadoop的這個特性,提供跨平臺, 跨服務的數據共用。讓用戶在充分享受Hadoop帶來的開放,便捷,創新的同時,繼續使用熟悉的數據(倉)庫方式管理和使用自己的海量數據。繼續使用傳統的數據倉庫的上層應用,特別是商業智能BI類的應用。