1. 引子 有人在某個專註SQL的公眾號留言如下: 這個留言觸碰到一個非常敏感的問題:搞關係型資料庫還有前途嗎?現在都2020年了,區塊鏈正火熱,AI人才已經“過剩”,大數據都成了稀鬆平常的蘿蔔白菜,你卻還在搞SQL Server? 你還在搞SQL? 你就是那個被時代淘汰的人! 2. 原因 最近10 ...
1. 引子****
有人在某個專註SQL的公眾號留言如下:
這個留言觸碰到一個非常敏感的問題:搞關係型資料庫還有前途嗎?現在都2020年了,區塊鏈正火熱,AI人才已經“過剩”,大數據都成了稀鬆平常的蘿蔔白菜,你卻還在搞SQL Server? 你還在搞SQL? 你就是那個被時代淘汰的人!
2. 原因
最近10年,數據管理領域的變化可謂精彩紛呈。什麼Hadoop, Spark,MemcacheDB, Redis, Vertica, HANA, Cassandra, MongoDB, InfluxDB,TiDB等等,不一而足。各類高端峰會、論壇確實只見AI, 大數據,確實很少見傳統關係型資料庫的身影了。
初步分析下來原因有四:
- 其一
雲計算的興起跟開源資料庫的大規模應用,大大降低了算力以及數據存儲的成本。
以傳統關係型數據的龍頭老大Oracle為例,隨著互聯網的興起,海量用戶產生了海量數據,但當Oracle大規模部署的時候,不僅Oracle軟體本身貴,與之配套的IBM小型機+EMC的存儲開支也相當龐大。比如Oracle的數據集群從一個房間搬到另外一個房間,收費都要十幾萬。軟硬體維護成本包括對管理員的要求也非常高。
另外Oracle本身也有性能的上限,其次是閉源的黑盒子。對於沒碰到過的場景,無論再怎麼努力,也是無法預測可能出現的問題的。”
中國的互聯網公司大部分都草莽出身,對於性價比極為看重。當年的互聯網老大美國的雅虎公司開始率先使用MySQL資料庫,中國的互聯網公司隨之跟進。
最典型的例子是阿裡巴巴。阿裡巴巴曾經被稱為Oracle的“明星客戶“,”黃埔軍校“。但隨著註冊用戶數激增,用戶產生的數據也越來越多,淘寶啟用了全亞洲最大的Oracle RAC集群,阿裡巴巴B2B中文站的數據量也因數據量大和業務要求,每年早上08:00—09:30之間CPU保持98%的使用率,伺服器負載也超高,即使採用冷熱隔離的方式也解決不了大容量數據且大併發的難題,更換存儲設備不久也會再次出現這樣的狀況。
阿裡巴巴被迫“攢出”一條去IOE的技術路線:“低成本、線性可控、去中心化(分散式):去IBM,PC Sever替代小型機;去Oracle,用MySQL替代;去EMC,用中低端存儲”。
在之後的爆髮式增長中,包括以2014,15,16年雙十一為代表的業務高峰,阿裡基於開源版本搞出來的MySQL分支很好地支撐了極其嚴苛的業務要求,最終很方便雲化同時又開源的MySQL在國內的互聯網公司逐步開始取代Oracle的江湖地位,成為諸多中國互聯網企業的首選。
- 第二
就是通用硬體成本的降低。隨著摩爾定律的作用隨著時間的發展性價比大大的提高。甚至出現了HANA,, Vertica,InfluxDB等等很多記憶體或者分散式記憶體資料庫。
那麼現在雲計算跟雲存儲到底有多便宜呢? 看看今天我剛從某網站截取的廣告吧:
這種面向市場大規模銷售的產品,因為採用可以採用廉價的PC Server,可以做到真正的白菜價,這在10年前根本無法想象。
- 第三
另外MySQL代碼跟文檔都是公開的,這樣對資料庫開發維護人員的要求相應的也就大大降低了。
- 最後
從SQL 發展到NoSQL,支持半結構化數據,非結構數據的資料庫大放異彩,之前這類無法處理的非結構化數據難題得到瞭解決,非結構化數據處理成為標準配置,似乎占據了市場熱點。
3. 現狀
那麼是不是傳統的關係型資料庫徹底成了昨日黃花呢?如果你這麼想,那就大錯特錯了!讓我們看看權威數據:
我們可以看到2013年到2019年,排名前三的基本上是Oracle, MySQL, Microsoft SQL Server,而且是常年大幅度領先。
由此可見非結構化數據雖然火熱,但是關係型資料庫仍然穩坐釣魚台!
原因在哪裡呢?資料庫發展絢麗多彩,但最終關鍵還在其擅長的業務場景。不同類型的資料庫適配不同的業務場景。在現實世界大量存在的結構化數據,關係型資料庫處理起它們來相對成熟,而且各方面優勢得天獨厚。現在大火的大數據重點在於其有效解決了之前一直無法處理的半結構化、非結構化數據這個老大難問題。讓非結構化資料庫擔當關係型資料庫的重任,無異於讓大卡車去跑小轎車拉力賽。
之前關係型資料庫確實占據了絕對的主流。只是近幾年隨著3G、4G的發展,圖片、音視頻內容略有增加。後面隨著5G、AR\VR、物聯網等等新技術的發展,存儲又會變貴,區塊鏈跟量子計算也會給世界帶來新的變化……
4. 發展
- 由單機、集群向徹底分散式發展,目前Oracle等資料庫已經實現
- OLTP跟OLAP的融合,這個特性很早就已經實現了
- 結構化非結構化的融合,目前Oracle, MS SQL Server等也已經實現
- 磁碟跟記憶體資料庫的融合,目前Oracle, MS SQL Server等也已經實現
- 行、列、圖、對象、文檔、內容、時序、搜索引擎、導航類等等不同類型的資料庫的融合,筆者初步研究發現已經小部分實現
- 初略分析來看,數據建模工具對以上特性的支持也在跟進中,但離完美支持還有很大距離
綜上來看,今後縱向上關係型資料庫發展相對成熟,目前其主要在往橫向上發展;非關係型資料庫主要在縱向上進一步做深做透。
5. 結論
不管世界怎麼發展,我認為關係型資料庫未來十年仍將是主流,再遠的將來也會有它重要的地位。因為在可預見的將來,結構化數據仍是人類最重要的數字資產,關係型資料庫也就會占據最重要的位置。
所以實質就是:不是關係型資料庫不重要,而是沒有太多新東西可以講;非結構化數據還有很大發展空間,所以大家比較關註。
光看什麼熱鬧學什麼,什麼火學什麼,浮躁的心態會讓人技術很難學得深入。相關從業者得搞清楚這個世界到底發生了什麼,以後會發生什麼。另外關鍵是得選準方向,坐得下來,鑽得進去。
關註我,每周一篇文章學習數據相關的知識。