關於複製,你瞭解多少(附副本集常見任務教程)

来源:https://www.cnblogs.com/mongoing/archive/2020/05/09/12858002.html
-Advertisement-
Play Games

MongoDB Manual (Version 4.2) Replication MongoDB中的副本集是一組維護相同數據集合的 mongod進程。副本集提供了冗餘和高可用性,並且這是所有生產部署的基礎。本節介紹MongoDB中的複製以及副本集的組件和體繫結構,並提供副本集常見任務的教程。 No1 ...


MongoDB Manual (Version 4.2)> Replication

MongoDB中的副本集是一組維護相同數據集合的 mongod進程。副本集提供了冗餘和高可用性,並且這是所有生產部署的基礎。本節介紹MongoDB中的複製以及副本集的組件和體繫結構,並提供副本集常見任務的教程。

No1 冗餘和數據

複製提供了冗餘並增加了數據可用性。對於不同資料庫伺服器上的多個數據副本,複製為防止單台資料庫伺服器故障提供了一定程度的容錯能力。
在某些情況下,複製可以提高讀取性能,因為客戶端可以將讀操作發送到不同的伺服器上。在不同的數據中心維護數據副本可以提高分散式應用程式的數據本地化和可用性。您還可以維護額外的副本以實現特殊用途,比如災難恢復、報告或備份。

No2 MongoDB的複製

副本集是一組維護相同數據集合的 mongod實例。副本集包含多個數據承載節點和一個可選的仲裁節點。在數據承載節點中,有且僅有一個成員為主節點,其他節點為副本節點。
主節點 接收所有的寫操作。一個副本集僅有一個主節點能夠用{ w: "majority" } 寫關註點級別來確認寫操作;雖然在某些情況下,另一個mongod的實例也可以暫時認為自己是主節點。[1] 主節點會將其數據集合所有的變化記錄到操作日誌中,即oplog。有關主節點操作的更多信息,請參見 副本集主節點。

副本節點複製主節點的oplog,並將這些操作應用於它們的數據集,這樣以便副本節點的數據集能反映出主節點的數據集。如果主節點不可用,一個候選的副本節點將會發起選舉並使之成為新的主節點。有關副本成員的更多信息,請參見副本集副本成員。

在某些情況下(比如您有一個主節點和一個副本節點,但由於成本約束無法添加另一個副本節點),您可以選擇將一個 mongod 實例作為仲裁節點添加到一個副本集中。仲裁節點參與選舉但不持有數據(即不提供數據冗餘)。有關仲裁節點的更多信息,請參見副本集仲裁節點。

仲裁節點永遠只能是仲裁節點,但在選舉過程中主節點也許會降級成為副本節點, 副本節點也可能會升級成為主節點。

No3 非同步複製

副本節點複製主節點的oplog並非同步地應用操作到它們的數據集。通過讓副本節點的數據集反映主伺服器的數據集,副本集可以在一個或多個成員失敗的情況下繼續運行。
有關複製機制的更多信息,請參見副本集Oplog和副本集數據同步。

慢操作

從4.2版本開始(從4.0.6開始也是可行的),副本集的副本成員會記錄oplog中應用時間超過慢操作閾值的慢操作條目。這些慢oplog信息被記錄在副本節點的診斷日誌中,其路徑位於REPL 組件的文本applied op: took ms中。這些慢日誌條目僅僅依賴於慢操作閾值。它們不依賴於日誌級別(無論是系統還是組件級別)、過濾級別,或者慢操作採樣比例。過濾器不會捕獲慢日誌條目。

複製延遲和流控制

複製延遲 指的是將主節點的寫操作拷貝(即複製)到副本節點所花費的時間。一些小的延遲期可能是可以接受的,但是隨著複製延遲的增長,會出現嚴重的問題,包括引起主節點的緩存壓力。
從MongoDB 4.2開始,管理員可以限制主節點應用寫操作的速度,目的是將majority committed 延遲保持在可配置參數flowControlTargetLagSeconds的最大值之下。
預設情況下,流控制是啟用的。

註意:

為了進行流控制,複製集/分片集群必須滿足:參數featureCompatibilityVersion (FCV) 設置為4.2並啟用majority讀關註點。也就是說,如果FCV不是 4.2 ,或者讀關註點majority被禁用,那麼啟用流控制將不起作用。
啟用流控制後,當延遲快接近flowControlTargetLagSeconds參數指定的秒數時,主節點上的寫操作必須首先獲得許可單(tickets)才可以獲取寫鎖。通過限制每秒發出的許可單的數量,流控制機制可以將延遲保持在目標數值之下。
為獲取更多信息,請參見檢查複製延遲和流控制。

No4 自動故障轉移

當主節點無法和集群中其他節點通信的時間超過參數electionTimeoutMillis配置的期限時(預設10s),一個候選的副本節點會發起選舉來推薦自己成為新主節點。集群會嘗試完成一次新主節點的選舉並恢復正常的操作。

副本集在選舉成功前是無法處理寫操作的。如果讀請求被配置運行在副本節點上,則當主節點下線時,副本集可以繼續處理這些請求。
假設採用預設的副本配置選項,集群選擇新主節點的中間過渡時間通常不應超過12秒。這包括了將主節點標記為unavailable、發起以及完成一次選舉的時間。您可以通過修改settings.electionTimeoutMillis 複製配置選項來調整這個時間期限。網路延遲等因素可能會延長完成副本集選舉所需的時間,從而影響您的集群在沒有主節點的情況下運行的時間。這些因素取決於您實際的集群架構情況。

將electionTimeoutMillis複製配置選項從預設的10000(10秒)降低可以更快地檢測主節點故障。然而,由於諸如臨時性的網路延遲等因素,集群可能會更頻繁地發起選舉,即使主節點在其他方面是健康的。這也許會增加w : 1 級別寫操作發生回滾的可能性。
您的應用程式連接邏輯應該包括對自動故障轉移和後續選舉的容錯處理能力。從MongoDB 3.6開始,MongoDB驅動程式可以探測到主節點的丟失,並自動重試某些寫操作 一次,提供額外的自動故障轉移和選舉的內置處理:

MongoDB 4.2相容的驅動程式預設啟用可重試寫
MongoDB 4.0和3.6相容的驅動程式必須通過在 連接字元串中包含retryWrites=true來顯式地啟用可重試寫。
請參見 副本集選舉來獲取副本集選舉的完整信息。

為瞭解更多關於MongoDB失敗處理的信息,請參見:
副本集選舉
可重試寫
副本集故障期間的回滾

No5 讀操作

讀偏好
預設情況下,客戶端從主節點讀取[1];然而,客戶端可以定義一個讀偏好 將讀操作發送給副本節點。

非同步複製至副本節點,意味著從副本節點讀取返回的數據不能反映主節點上數據的狀態。
包含讀操作的多文檔事務必須使用讀偏好primary。在給定的事務中所有操作都必須路由至相同的成員節點。
為瞭解更多關於副本集讀的信息,請參見讀偏好。

數據可見性
根據讀關註點,客戶端可以在寫持久化前看到寫結果:
不管寫的write concern級別是什麼,其他使用了讀關註點級別為 "local" 或 "available" 的客戶端,可以在發起寫操作的客戶端確認其寫成功之前查看該客戶端寫的結果。
使用了讀關註點級別為 "local" 或 "available" 的客戶端,能讀取在副本集故障轉移期間可能隨後被回滾掉的數據。
對於多文檔事務中的操作,當事務提交時,在事務中所做的所有數據更改都會被保存併在事務外部可見。也就是說,事務在回滾其他更改時不會提交某些更改。
在事務提交之前,事務中所做的數據更改在事務外部是不可見的。
然而,當一個事務寫入多個分片時,並不是所有外部的讀操作都需要等待提交的事務的結果在分片中可見。例如,如果提交了一個事務,並且在分片a上可以看到寫1,但是在分片B上還不能看到寫2,那麼外部讀關註點為 "local" 的讀可以在不看到寫2的情況下讀取寫1的結果。
更多請參見Read Isolation, Consistency, and Recency。

No6 事務

從MongoDB 4.0開始,副本集支持多文檔事務。
包含讀操作的多文檔事務必須使用讀偏好 primary。給定事務中所有的操作都必須路由至相同的成員節點。
在事務提交之前,事務中所做的數據更改在事務外部是不可見的。
然而,當一個事務寫入多個分片時,並不是所有外部的讀操作都需要等待提交的事務的結果在分片中可見。例如,如果提交了一個事務,並且在分片a上可以看到寫1,但是在分片B上還不能看到寫2,那麼外部讀關註點為 "local" 的讀可以在不看到寫2的情況下讀取寫1的結果。

No7 變更流

從MongoDB 3.6開始,副本集和分片集群支持變更流。變更流允許應用程式訪問實時數據更改,而不需要跟蹤oplog的複雜性和風險。應用程式可以使用變更流來訂閱一個或多個集合上的所有數據更改。

No8 附加功能

副本集提供了許多選項來支持應用程式的需求。例如,你可以使用多數據中心中的成員來部署一個副本集,或者通過調整一些成員的members[n].priority 來控制選舉結果。副本集還支持用於報告、災難恢復或備份功能的專用成員。
更多有關信息請參見優先順序0的副本集成員,隱藏副本集成員和延遲副本集成員 。
註意:
(1, 2) 在 某些場景下, 一個複製集中的兩個節點可能會認為它們是主節點,但最多,他們中的一個將能夠完成寫關註點為{ w: “majority” }寫操作。可以完成 { w: “majority” } 寫的節點是當前主節點,而另一個節點是原先的主節點,通常是由於網路分區導致它還沒有意識到自己的降級。當這種情況發生時,連接到原先主節點的客戶端儘管已經請求了讀偏好primary,但可能還會觀察到過時的數據,並且對原先主節點新寫的操作最終將回滾掉。

譯者:李正洋
MongoDB中文社區翻譯小組成員
目前在傳統金融行業從事DBA職務,5年+工作經驗,主要負責公司oracle/mongodb/es/redis各類資料庫及數據中心監控平臺運維工作,oracle ocp,MongoDB認證專家,RHCE,現階段對開源分散式資料庫、雲計算等領域有很大興趣;平時喜歡打羽毛球、看電影等。
原文鏈接:
https://docs.mongodb.com/manual/replication/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 常用選項: -i #直接修改目標文件內容. -n #取消預設輸出. 實例: #刪除 sed -i '/content/d' temp.txt #刪除中temp.txt匹配content內容的行. sed -i '/^$/d' temp.txt #刪除文件中所有空行. sed -i 'nd' temp ...
  • public static class QueryableExtension { public static IQueryable<T> Paged<T>(this IQueryable<T> query, Expression<Func<T, object>> expression, OrderB ...
  • 十四、讀寫分離 Atlas架構 1、安裝軟體 2、修改配置 3、啟動atlas 4、測試 5、管理atlas 6、擴展——atlas 自動分表 ...
  • 十三、mysql高可用 1、普通主從複製架構存在的不足 高可用? 業務不間斷的工作。 用戶的體驗不出來業務斷點。 普通主從環境,存在的問題: 2、企業高可用解決方案: MMM(過時) MHA(目前推薦) PXC、Galera Cluster(出現很多年,企業很少用) 5.7.17 MGR 、Inno ...
  • 十二、mysql主從複製 1、主從複製原理 1.主從複製的前提: 1.1兩台mysql實例(多台物理機,或者多實例) 1.2主庫要開啟二進位日誌 1.3主庫要提供複製相關用戶,replication slave,一個比較特殊的許可權。 1.4從庫需要將和主庫相差的數據,進行追加 一般情況下可以人為備份 ...
  • DDL語言庫與表的管理(創建、修改、刪除)、一些常見的數據類型(整形、浮點|定點、日期,字元) ...
  • 創建資料庫 -- Firsr way CREATE DATABASE database_name; -- Second way CREATE SCHEMA database_name; 2.創建表 CREATE TABLE birds( bird_id INT AUTO_INCREMENT PRIM ...
  • 思考: 大家可以思考一下下麵sql語句寫的有沒有問題? select jg.id as goodsId,jm.name,... from jdy_merchant jm left outer join jdy_express_template jet on jet.id = jg.freight l ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...