在沒有出現資料庫之前,數據存儲在文本中,這種數據存儲方式不管是管理還是查詢,效率都是極其低下的,數據之間沒有關聯性。到了1970年,IBM研究員 E.F.Codd 發表了論文"A Relational Model of Data for Large Shared Data Banks",該論文中第一 ...
在沒有出現資料庫之前,數據存儲在文本中,這種數據存儲方式不管是管理還是查詢,效率都是極其低下的,數據之間沒有關聯性。到了1970年,IBM研究員 E.F.Codd 發表了論文"A Relational Model of Data for Large Shared Data Banks",該論文中第一次提出了關係模型的概念,為關係型資料庫奠定了基礎,才有了後面涌現的如IBM的DB2、甲骨文的Oracle等優秀的關係型資料庫。一直到上世紀90年代,資料庫都是以關係型資料庫為主。但隨著數據量的增長,關係型資料庫已無法滿足更多的應用場景,資料庫領域便隨之出現了非關係型資料庫。
資料庫分類
資料庫用於數據的存儲和訪問,不同類型的資料庫也會滿足不同的場景需求。如果你的資料庫對事務沒有要求,且讀寫是高併發的,那麼你可以選擇一款非關係型資料庫。如果你的資料庫主要存儲歷史數據,且訪問頻率少,那麼你可以選擇一款高壓縮比,且讀優化的資料庫。如果你的資料庫既有交易類業務,又有複雜分析類業務,那麼你可以選擇一款有混合存儲引擎的資料庫。
資料庫按照數據模型來劃分,可分為關係型資料庫和非關係型資料庫。關係型資料庫的數據是高度組織化和結構化的,可以使用結構化查詢語言進行複雜的查詢。非關係型資料庫的數據是非結構化的,沒有聲明性查詢語言,代表著不僅僅是SQL。關係型資料庫註重事務的強一致性,而非關係型資料庫註重可擴展性。資料庫市場使用廣泛的關係型資料庫有 Oracle 、 MySQL 、 SQL Server ,資料庫市場使用廣泛的非關係型資料庫有 Redis 、MongoDB 。
資料庫按照數據分佈來劃分,可分為集中式資料庫和分散式資料庫。集中式資料庫是一個或者多個資料庫實例管理一份數據,每個資料庫實例都可以看到全部數據,屬於 Shared-Everything 架構。分散式資料庫是每個資料庫實例管理自己的數據,全量數據是所有資料庫實例管理的數據的總和,屬於 Shared-Nothing 架構。
資料庫按照數據處理來劃分,可分為 OLTP 資料庫、OLAP 資料庫以及 HTAP 資料庫,StoneDB 就是一款一體化實時 HTAP 資料庫,後面幾個課程會給大家深入介紹。OLTP 資料庫適用於交易類系統,特征是大併發的小型事務處理,單次處理的數據量小。OLAP 資料庫適用於分析類系統,特征是併發小,系統吞吐量高,單次處理的數據量大。HTAP 資料庫是一種新型的架構,指的是混合事務和分析處理過程,出現 HTAP 的目的是打破 OLTP 和 OLAP 之間的壁壘。
資料庫瓶頸
傳統資料庫經過五十多年的發展,不管是資料庫本身的穩定性,還是資料庫廠商的技術支持度,都已經非常的成熟。資料庫廠商在官網提供的豐富學習資料,對使用者來說很容易學習這款資料庫。但隨著時代的發展,特別是出現互聯網技術,資料庫的數據量是指數增長的,那麼傳統資料庫不僅在併發和存儲上存在瓶頸,在可擴展性也是有限的。
當傳統關係型資料庫出現無法滿足業務場景的需求,如出現高併發的海量數據存儲時,出現了分散式資料庫。分散式資料庫由多台伺服器組成,不僅提供更多的連接訪問,還提供更多的存儲容量,在可擴展性方面也是線性的。分散式資料庫解決了傳統資料庫的瓶頸,然而分散式資料庫也不是完美的無懈可擊。
在事務一致性方面,傳統資料庫很容易保證 ACID ,而分散式資料庫由多個資料庫實例組成,分佈在一個網路環境中,為了保證事務的一致性,引入了兩階段提交、三階段提交、補償事務。分散式事務在管理開銷也是較大的,比如對悲觀鎖的支持,雖然一致性讀無需持有鎖,但查詢也可能會被阻塞。
在基於成本的執行計劃方面,由於數據分佈在不同的節點,再加上分散式演算法的複雜度,SQL 是否能保證有一個穩定的執行計劃。
在數據一致性方面,分散式資料庫以多副本進行存儲時,數據的一致性問題變得更為複雜。假設正在更新某個副本時伺服器發生故障,在這種情況下如何確保故障恢復後伺服器上的副本與其他副本保持一致。
國產資料庫
多年來國外資料庫廠商處於絕對的主導地位,隨著近幾年IT國產化戰略的提出,國內涌現出了多個資料庫廠商,形成了百家爭鳴。有發展多年的關係型資料庫,如達夢、人大金倉、南大通用等;有勢頭猛進的分散式交易型資料庫,如 TiDB 、 OceanBase 等;也有穩扎穩打的分散式分析型資料庫 GaussDB 。
(國產資料庫)
StoneDB 作為自主設計、研發的國內首款基於 MySQL 內核打造的開源 HTAP 資料庫,在同一個資料庫實例中採用行列混合存儲的方案,解決了 TP 和 AP 的問題,同時可實現與 MySQL 的無縫切換。由於100%相容 MySQL ,讓運維變的更簡單,用戶的體驗感也更佳。
下節課我們將帶大家深入瞭解 StoneDB 的系統架構和功能特點,請持續關註。關於StoneDB的任何問題,都可以加我V咨詢:StoneDB_2022 。