1.基於數據文件的備份 直接將原始的數據文件Copy至備份的地方,這個方法的優點是比較快,因為備份和恢復都不需要轉換數據格式。缺點就是需要鎖住資料庫伺服器,但是此方案通常備份是在從節點上進行,備份過程不影響應用的正常運行。 如果不鎖住數據,經常會導致複製文件中斷,另外就是保證數據文件的一致性狀態。 ...
1.基於數據文件的備份
直接將原始的數據文件Copy至備份的地方,這個方法的優點是比較快,因為備份和恢復都不需要轉換數據格式。缺點就是需要鎖住資料庫伺服器,但是此方案通常備份是在從節點上進行,備份過程不影響應用的正常運行。
如果不鎖住數據,經常會導致複製文件中斷,另外就是保證數據文件的一致性狀態。
主要命令:
加鎖的命令--db.fsyncLock()
註意:鎖之後的任何嘗試寫入都會被阻止,而且讀操作也會被阻止。新的連接嘗試也會被阻止。
解鎖的命令--db.fsyncUnlock()
註意:這僅僅是個解鎖請求,資料庫可能無法正確解鎖。運行db.currentOp方法可以驗證資料庫是否還處於鎖狀態。
2.mongodump
mongodump導出的是bson格式,是二進位形式。此工具對於恢復整個實例、單個資料庫、指定集合都十分有用。他們可以用於備份實時運行的資料庫(無需鎖住或者關閉資料庫)。
mongorestore用於讀取恢復這些文件。
部分主要命令參數 如下:
-h [ --host ] --資料庫所在主機IP地址;
–port --mongodb使用的埠號;
-u [ --username ]--登陸用戶名;
-p [ --password ] --用戶的登陸密碼;
-d [ --db ] --準備備份的資料庫;
-c [ --collection ] --準備備份的集合;
-o [ --out ] --導出數據將要保存在的目錄;
-q [ --query ] --指定備份的查詢條件;
–oplog --快照式備份,保證數據的時間一致性和完整性;
--authenticationDatabase --用戶的登錄驗證資料庫
--gzip --備份文件壓縮
例子:
將埠為37017的MongoDB數據備份到 /opt/backup/mongodump-2011-10-24 路徑下,登入驗證需輸入密碼。
mongodump --host mongodb1.example.net --port 37017 --username user --password "pass" --out /opt/backup/mongodump-2011-10-24
3.mongoexport
mongoexport命令行用於數據的導出,預設導出的文件格式為JSON格式,還支持csv格式。
部分主要命令參數 如下:
-h,--host :代表遠程連接的資料庫地址,預設連接本地Mongo資料庫;
--port:代表遠程連接的資料庫的埠,預設連接的遠程埠27017;
-u,--username:代表連接遠程資料庫的賬號,如果設置資料庫的認證,需要指定用戶賬號;
-p,--password:代表連接資料庫的賬號對應的密碼;
-d,--db:代表連接的資料庫;
-c,--collection:代表連接資料庫中的集合;
-f, --fields:代表集合中的欄位,可以根據設置選擇導出的欄位;
--type:代表導出輸出的文件類型,包括csv和json文件;
-o, --out:代表導出的文件名;
-q, --query:代表查詢條件;
與mongodump相比,從功能上來講,mongoexport可以細化到集合中的欄位,可以根據需要只導出指定的欄位。從文件格式上來看,不再是Bson格式的文件,而是直接可讀的Json或CSV文件,容易被第三方程式讀取利用。缺點就是備份性能減低了。
在開發的數據變更需求中,有時候 考慮到 數據的重要性和可溯性,部分需求會要求我們將數據臨時備份到一個集合中,便於回滾和查詢比較。這時候登錄到伺服器上,根據條件執行mongoexport 導出和 mongoimport 再次導入, 雖然可以實現備份的需求,但這有一個前提要求,就是有伺服器登入和執行的許可權,且過程還相對繁瑣。如果MongodB部署在雲上,上面mongoexport的備份方案就歇菜了,我們不能登入雲庫的物理機。此外,雲上資料庫雖然還可以還原實例,但代價相對較大。
相信這時候,我們會不由自主的懷念 SQL Server / MySQL 的 insert into XXXX_bak select * from XXXX。如果 MongoDB也有這種輕量級的備份該多好啊。
其實,在MongoDB的命令中,也有類似功能代碼。在這裡我們,我們講解下Cursor游標和聚合框架的$out。
4.cursor.forEach()
Cursor,又稱游標。
游標不是查詢結果,可以理解為數據在遍歷過程中的內部指針,其返回的是一個資源,或者說數據讀取介面.客戶端通過對游標進行一些設置就能對查詢結果進行有效地控制,如可以限制查詢得到的結果數量、跳過部分結果、或對結果集按任意鍵進行排序等。
db.collection.find()可以實現根據條件查詢和指定使用投影運算符返回的欄位(省略此參數返回匹配文檔中的所有欄位)。並返回到匹配文檔的游標,可以隨意修改查詢限制、跳躍、和排序順序的功能。
游標有一個重要的迭代函數---cursor.forEach(回調函數),允許我們自定義回調函數來逐個處理每個單元.
基本語法格式:
db.collection.find().forEach(<function>)
例如,我們需要修改集合QQOrder中創建時間為指定時間,狀態為10的訂單,因為訂單數據不能輕易修改,除流程式控制制外,要求DBA在修改前備份一下。
以下代碼是將符合條件的數據備份至QQOrder_bak集合中。
db.QQOrder.find( {"Status" : "10", "Rec_CreateTime" : {$gt:ISODate("2018-11-18T15:37:20.740+08:00"),$lt:ISODate("2018-11-20T15:37:20.740+08:00")} } ).forEach( function(x){ db.QQOrder_bak.insert(x) } )
5.聚合框架--$out
我們知道在聚合框架中有一個步驟--$out,可以把管道的結果寫入某個集合中(2.6版新增)。
使用$out操作符,可以自動把聚合管道的輸出結果保存到集合里。如果集合不存在的話,則$out操作符將會創建一個集合,或者如果存在就會完全取代現有的集合。此外,如果創建新的集合失敗的話,MongoDB不會修改之前的集合。
所以,針對上面的需求,使用下麵的代碼也可以實現。
(測試過程中,將上一個案例備份集合由QQOrder_bak替換成了QQOrder_bak_2)
db.QQOrder.aggregate([ {$match: {"Status" : "10","Rec_CreateTime" : {$gt:ISODate("2018-11-18T15:37:20.740+08:00"),$lt:ISODate("2018-11-20T15:37:20.740+08:00")}}}, {$out:'QQOrder_bak_2'} ])
需要特別註意的話,QQOrder_bak_2只可以臨時存放數據,如果再次執行新的導出,會將集合中原來的數據覆蓋掉。
以上五種備份,可以涵蓋我們日常所有的備份需求了。包含 實例、庫的日常災備,也有業務需求的臨時備份。
本文版權歸作者所有,未經作者同意不得轉載,謝謝配合!!!