MongoDB 如何實現備份壓縮

来源:https://www.cnblogs.com/xuliuzai/archive/2018/09/05/9594138.html
-Advertisement-
Play Games

背景及原理 資料庫的備份是災難恢復的最後一道屏障,不管什麼類型的資料庫都需要設置資料庫備份,MongoDB也不例外。MongoDB 3.0 後 ,資料庫可以採用Wiredtiger存儲引擎後(3.2 版本預設),在此環境下通過mongodump 備份後,產生的備份文件要遠大於數據存儲文件的大小。此外 ...


背景及原理                                         

資料庫的備份是災難恢復的最後一道屏障,不管什麼類型的資料庫都需要設置資料庫備份,MongoDB也不例外。MongoDB 3.0 後 ,資料庫可以採用Wiredtiger存儲引擎後(3.2 版本預設),在此環境下通過mongodump 備份後,產生的備份文件要遠大於數據存儲文件的大小。此外,一般MongoDB存儲的數據量比較大,備份文件也比較大,占用了很多磁碟空間。所以,研究如何實現MongoDB備份壓縮很有必要。

上圖是執行命令 db.stats() 查看某資料庫的信息。

備份文件的大小一般為dataSize的大小,所以我們希望壓縮備份,可以達到storageSize 或者更小。

般的備份思路是先備份,後對備份文件進行壓縮。之前,我們採用的就是這種方式,例如主要壓縮命令如下

tar -cf - ${targetpath}/${nowtime} | pigz -p 10 > ${targetpath}/${nowtime}.tgz

(命令解釋: targetpath}/${nowtime 為待壓縮的備份文件;pigz 是Linux壓縮神器,可並行壓縮;-p是指定cpu的核數。)

 

但是這種方式,生成備份文件的過程中還是容易形成磁碟性能壓力和空間壓力。下圖為我們某台Server 採用先備份後壓縮方式,形成的磁碟可用空間變化。

真正希望的是備份的同時進行壓縮,這樣可用空間就比較平穩了。在MongoDB 3.2 中 引入了一種壓縮式備份【此mongodb版本必須不低於3.2】。可以使用gzip進行壓縮。這是通過在mongodump和mongorestore中引入一個新的指令行選項“- -gzip”實現的。

壓縮可用於目錄以及歸檔模型下創建的備份,壓縮還可以減少磁碟空間使用。

 

測試

測試環境:

 

測試伺服器

測試資料庫

文件路徑

172.X.X.245

實例全備

17219

/data/mongodb_back

172.X.X.246

QQ_DingDing

17218

/data/mongodb_back/QQ_DingDing

 

 

 

 

 

 

 

Step 1 壓縮式備份的命令:

 

./mongodump --host 172.X.X.245 --port 17219 -u 用戶名 -p "密碼" --gzip --authenticationDatabase "admin" --out /data/mongodb_back 

 

備份後文件的大小,97M

這時候,查看備份文件的格式都變成了.gz的格式

 

Step 2 將備份文件copy至遠程機器上,進行還原:

 

以下命令是將在172.X.X.246,要求是將文件從X.245 copy至本地

scp -r [email protected]:/data/mongodb_back/QQ_DingDing

 

step 3 執行還原的命令 

 

執行的命令

./mongorestore --host 172.X.X.246 --port 17218 -d QQ_DingDing -u 用戶名 -p "密碼" --gzip --authenticationDatabase "admin" /data/mongodb_back/QQ_DingDing

還原後登錄MongoDB,執行show dbs,查看此時 數據大小為500M。

補充說明

 

(1)    如果不採用壓縮式的備份,備份後的文件會是多大呢?備份命令 :

./mongodump --host 172.X.X.245 --port 17219 -u 用戶名 -p "密碼" --authenticationDatabase "admin" --out /data/mongodb_back2

查看此種方法備份後的文件大小--1.5G。

以此QQ_DingDing資料庫為例,其壓縮率為(文件壓縮後的大小與壓縮前的大小之比):97M/1.5G=97/1536=6.3%

 

(2)   這種壓縮備份的方式的會不會帶來一些弊端:例如備份時間增長?(恢復時間增加?,請自測一下試試,嘻嘻 @@@)

以 某歸檔備份庫所在實例為例(storageSize 150G,dataSize 600G )

採用 先備份後壓縮的方式耗時1小時55分鐘

 

  採用壓縮式備份(指定--gzip參數)的方式耗時 2小時33分鐘

   

產生的備份文件大小基本相等,壓縮式備份方式產生的備份文件略小

所以 壓縮式備份會導致備份時間增長。

 

但從空間使用的角度來講,我們仍然建議大家使用壓縮式備份,其壓縮比非常高(測試案例的壓縮比6.3%)。

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Windows 下安裝drozer(Windows 10),連接手機(紅米note4X) 首先下載drozer(http://mwr.to/drozer)。 紅米手機開發者模式 遇到第一個問題,紅米手機開發者模式。好久不用這個了,發現找不到。網上搜索一波, 在設置-我的設備-全部參數,位置,點擊MI ...
  • Sharding-Proxy是Sharding-Sphere的第二個產品。它定位為透明化的資料庫代理端,提供封裝了資料庫二進位協議的服務端版本,用於完成對異構語言的支持。目前先提供MySQL版本,它可以使用任何相容MySQL協議的訪問客戶端(如:MySQL Command Client, MySQL... ...
  • linux下,資料庫意外關閉,可能導致連接不了。可能報錯: 解決方法: 第一步:看監聽起來沒有 或者 第二步:如果沒有,則開啟 第三步:再次查看: 第四步:登錄資料庫 第五步:以管理員許可權連接 第六步:啟動資料庫 ...
  • 1.utf8與utf8mb4(utf8 most bytes 4) MySQL 5.5.3之後增加了utfmb4字元編碼 支持BMP(Basic Multilingual Plane,基本多文種平面)和補充字元 最多使用四個位元組存儲字元 utf8mb4是utf8的超集並完全相容utf8,能夠用四個字 ...
  • MySQL實現排名並查詢指定用戶排名功能,併列排名功能 表結構: CREATE TABLE test.testsort ( id int(11) NOT NULL AUTO_INCREMENT, uid int(11) DEFAULT 0 COMMENT '用戶id', score decimal( ...
  • 1,索引 2.exists 代替 in 3.SQL優化 4、觸發器[表上創建的] 5、存儲過程【創建在資料庫上的】 6、資料庫引擎ENGINE【MYISAM,INNODB】 7、MySQL如何修改密碼 ...
  • 服務端與瀏覽器收發信息: socket 套接字 是應用層和傳輸層之間一個虛擬層,是一個介面. 列印一下收到的消息是什麼>??? 那瀏覽器收到的消息是什麼? 通過以上對比,發現收發消息的格式都是一樣的 即為 HTTP協議格式 每個HTTP請求和響應都遵循相同的格式,一個HTTP包含Header和Bod ...
  • 1.需求簡介 最近開發人員需要進行一批數據進行生產上SQL語句耗時過長問題的驗證與優化。所以在性能測試庫中批量建造數據,由於交易本身業務邏輯過於複雜以及需要各種授權,最後決定採用插表的方式完成。 2.所用工具 DbVisualizer 10.0.14(已破解)(並不需要本地存在DB2客戶端,DbVi ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...