NoSQL資料庫興起

来源:https://www.cnblogs.com/taojinxuan/archive/2019/07/04/11130328.html
-Advertisement-
Play Games

前言 近幾年NoSQL資料庫興起,各種新的產品層出不窮,在此學習下NoSQL的基本理論,並認識下常見的NoSQL資料庫。 一 NoSQL資料庫興起的原因 隨著大數據技術興起和Web2.0時代的到來。傳統關係型資料庫已經無法滿足當前的資料庫需求了。 無法滿足的需求主要有3點: 海量數據的存儲與管理 ( ...


前言

近幾年NoSQL資料庫興起,各種新的產品層出不窮,在此學習下NoSQL的基本理論,並認識下常見的NoSQL資料庫。

一 NoSQL資料庫興起的原因

隨著大數據技術興起和Web2.0時代的到來。傳統關係型資料庫已經無法滿足當前的資料庫需求了。

無法滿足的需求主要有3點:

  • 海量數據的存儲與管理 (傳統關係型資料庫已經無法支撐
  • 大數據量下的併發性 (傳統關係型資料庫嚴格的事務機制導致了海量數據的操作會導致大範圍的數據鎖定,降低併發性
  • 高可用性,高擴展性(用戶更關註是否功能可用。海量數據需要橫向擴展資料庫滿足需求,縱向已經無法滿足

與之相比原本關係型資料庫的優點已經不被許多公司所需要,主要也有3點:

  • 嚴格的資料庫事務(如微信,新浪微博等互聯網公司,丟失一條消息等,ACID的實現與否並不是很重要
  • 嚴格的讀寫實時性(同理,一條消息伺服器寫入後,其他人是否立即看到並不太重要
  • 複雜的條件查詢(為了節約硬體存儲空間降低冗餘,傳統關係型資料庫會將各種信息分表存儲,但是現在硬體性能已經足夠將信息全部存儲。並不太需要複雜的多表查詢操作

為了滿足大數據量下的業務需求,傳統關係型資料庫也發展出多種技術手段,但是最終事實證明NoSQL資料庫才是最適合的選擇。傳統關係型資料庫的解決方案經歷瞭如下幾個階段:

  1. 主從複製,實現讀寫分離。設置一個主伺服器,若幹從伺服器。主伺服器負責寫操作,並實時複製修改內容到從伺服器上。從伺服器負責讀操作。(但是對於寫請求的負擔仍然無法解決
  2. 分庫,分流一部分請求。分庫又分為橫向分庫和縱向分庫,橫向分庫即將不同業務維度的資料庫拆分開來,伺服器根據業務場景,查詢不同資料庫。縱向分庫即將數據行按照一定的規律分別存儲到不同資料庫內。如:根據hash,根據生產時間等。(但是導致了不同庫之間不能直接查詢,且仍然無法滿足更大的數據要求
  3. 分表,類似於分庫。通過橫向或者縱向切分表。

二 NoSQL資料庫的四大類型

分別是 :

  • 鍵值資料庫
  • 列族資料庫
  • 文檔資料庫
  • 圖資料庫

2.1 普遍的特性(優點)

  • 數據結構靈活。(傳統關係型資料庫有嚴格的欄位要求,且後續修改複雜
  • 可擴展性強(容易橫向擴展,支持分散式,且擴展的複雜度不高,對比傳統關係型資料庫的擴展非常複雜
  • 支持高併發操作。

2.2 各自的特性

  1. 鍵值資料庫。是鍵值對的存儲資料庫。
  • 優點:適合大量寫操作。
  • 缺點:但是存儲的數據沒有結構化,複雜查詢效率低。
  • 應用:常用做內容緩存。
  • 代表產品:Redis,Memcached
  1. 列族資料庫,底層基於列族進行存儲的資料庫。(查找時,基於行鍵列族查找,可以看做鍵值資料庫的變種)
  • 優點:查詢速度快,橫向擴展性尤其好,適合分散式系統,屏蔽了分散式的複雜性。
  • 缺點:功能簡單,大都不支持事務一致性。(Hadoop的HBase是支持的
  • 應用:分散式的數據存儲。
  • 代表產品:Cassandra,HBase
  1. 文檔資料庫,基於鍵存儲文檔。(也可看做鍵值資料庫的變種)
  • 優點:半結構化,數據格式可以自解釋,如:JSON,XML。因此數據結構非常靈活,且併發性高。
  • 缺點:缺乏統一的查詢語法
  • 應用:存儲文檔型數據,半結構化數據。
  • 代表產品:MongoDB,CouchDB
  1. 圖資料庫,基於圖數據結構的資料庫。
  • 優點:支持複雜的圖演算法與關係圖譜
  • 缺點:只適合圖和關係的應用領域,其他領域性能較差。
  • 應用:複雜圖結構,如社交網路,關係圖譜。
  • 代表產品:Neo4J,InfoGrid

三 NoSQL資料庫的三大基石

3.1 CAP理論三個特性

  • C:一致性(任何一個讀操作總是能讀取到之前完成的寫操作結果)
  • A:可用性(每一個操作總是能夠在確定的時間內返回,也就是系統隨時都是可用的)
  • P:分區容忍性(出現網路分區,整個系統仍然可用)

經過證明,一個分散式系統不能同時滿足三個特性,最多滿足兩個。

傳統關係型資料庫滿足了CA,放棄了P。因此擴展困難。而現在大部分互聯網系統都是分散式系統,不可能放棄P特性。

通俗的解釋下為何只能同時滿足兩個特性:

假設同時滿足C和A和P。P保證了系統存在不同的網路節點,那麼為了保證C,系統會嘗試與其他的節點同步數據信息,但是出現網路問題導致系統分區時(即節點無法互相通信),會導致同步無法立刻完成,這樣就無法滿足A了。

此時只需要去除一個特性即可:

  1. 去除P,保留CA。則沒有了網路通信問題,在實現C數據一致性時,可以很快的完成,也保證了A。
  2. 去除A,保留CP。則不要求立刻完成,在實現C數據一致性時,即使出現了網路分區P,也可以慢慢等待。
  3. 去除C,保留AP。則不需要保證數據一致性了,即使網路出現分區,各個節點都能單獨運行,保證了用戶可用(反正系統已經不在乎各個節點數據的一致了)。

3.2 BASE理論

BASE模型反ACID模型,完全不同ACID模型,犧牲高一致性,獲得可用性。

  • BA:基本可用。一部分分區出現問題,系統仍然可用,主要保證核心功能可用。(電商大促時,為了應對訪問量激增,部分用戶可能會被引導到降級頁面,服務層也可能只提供降級服務。這就是損失部分可用性的體現
  • S:軟狀態。數據的一致性要求降低,可以一段時間不滿足一致性。相對應的是硬狀態。(分散式存儲中一般一份數據至少會有三個副本,允許不同節點間副本同步的延時就是軟狀態的體現。mysql replication的非同步複製也是一種體現。
  • E:最終一致性。弱一致性,後續操作無法立刻獲取更新的信息。相對應的是強一致性。最終一致性是特殊的弱一致性,只保證了。

3.3 最終一致性

(明明BASE就包含了最終一致性,不知道書中為何又將它單獨列為三大理論基礎之一)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 新增用戶 創建一個名為qiang,其家目錄位於/usr/qiang的用戶 或直接這樣,則用戶的家目錄會預設為/home/目錄 用戶密碼初始化 賦予root許可權 修改文件/etc/passwd,將用戶名為qiang的用戶ID修改為0即可 用戶信息為 ,將其修改為 查看所有的用戶信息 每一行代表一個用戶 ...
  • 1,安裝mutt 2,安裝msmtp 3,設置mutt /etc/Muttrc # 系統全局設置 ~/.muttrc # 使用某個系統用戶 4,設置msmtp 創建 ~/.msmtprc 和 ~/.msmtp.log 分別為配置和日誌文件 5,查看SMTP伺服器是否支持認證的TLS加密 可見支持認證 ...
  • 學習目標: 通過本實驗掌握centos7/rhel7下journalctl和rsyslog日誌工具的使用,建立通過查看日誌分析排錯的思路,以及日誌內容的查找,分類重定向的使用。 實驗步驟: 1、不配置本機IP地址,但試著啟動DHCP服務,會報錯 2、運行journalctl工具,從日誌中查找服務報錯 ...
  • 更新:zip亂碼的問題可以通過安裝patch之後的 和`unzip natspec`解決(archlinuxcn源),而仍使用Engrampa做前端。此文重點在pygtk... 問題是這樣的: 一切都起源於一個壓縮文件的亂碼… Windows的編碼真的是為所欲為,讓Linux這種守規矩的小傻子措手不 ...
  • 1. 使用ifconfig命令來維護網路 1) ifconfig命令的功能:顯示所有正在啟動的網卡的詳細信息或設定系統中網卡的IP地址。 2) 應用ifconfig命令設定網卡的IP地址: 例如:修改eth0網卡的IP地址為172.18.48.56和子網掩碼255.255.255.128的命令: i ...
  • 1. 安裝/升級Docker客戶端 推薦安裝1.10.0以上版本的Docker客戶端,參考文檔 docker-ce 1. 安裝/升級Docker客戶端 推薦安裝1.10.0以上版本的Docker客戶端,參考文檔 docker-ce 2. 配置鏡像加速器 針對Docker客戶端版本大於 1.10.0 ...
  • 1. Linux文件系統的層次結構 1) Linux文件系統的樹狀結構: 在Linux或UNIX操作系統中,所有的文件和目錄都被組織成一個以根節點開始的倒置的樹狀結構。 2) 目錄的定義: 目錄相當於Windows中的文件夾,目錄中存放的既可以是文件,也可以是其他的子目錄。 3) 頂層根目錄的表示: ...
  • 1. Linux命令的格式 1) Linux命令的語法格式: 命令 【選項】 【參數】 2) 命令格式中命令、選項、參數的具體含義 a) 命令:告訴Linux(UNIX)操作系統做(執行)什麼。 b) 選項:說明命令運行的方式(可以改變命令的功能)。選項部分是以“-”字元開始的。 c) 參數:說明命 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...