MongoDB - 入門指南

来源:https://www.cnblogs.com/fatedeity/archive/2022/11/14/16887933.html
-Advertisement-
Play Games

簡單瞭解 MongoDB 的基本概念之後,就需要瞭解其提供的一些工具和數據邏輯結構,以真正開始入門 MongoDB 的學習。 ...


組件結構

核心進程

在 MongoDB 中,核心進程主要包含了 mongod、mongos 和 mongosh 三個。

其中最主要的是 mongod 程式,其在不同的部署方案中(單機部署、副本集部署、分片集群部署),通過不同的配置,可以扮演多種不同的角色:

  • 在單機部署中作為資料庫伺服器(提供所有讀寫功能)
  • 在副本集部署中,通過配置,可以部署為 Primary 節點(負責寫數據,也可以提供查詢)、Secondary 節點(從主節點複製數據,也可以提供查詢)、以及 Arbiter 節點(不保存數據,主要用於參與選舉投票)
  • 在分片集群中,除了在每個分片中扮演上述角色外,還扮演著配置伺服器的角色(存儲有分片集群的所有元數據信息,mongos 的數據路由分發等都要依賴於它)

在一臺伺服器上,可以啟動多個 mongod 服務。但在實際生產部署中,通常是建議一臺伺服器部署一個 mongod 實例,這樣不僅減少資源競爭,而且伺服器故障也不會同時影響到多個服務。

mongos 在分片集群中扮演路由的角色,提供客戶端和分片之間的介面。

mongosh 是 MongoDB 集成的互動式 shell 工具。

資料庫工具

MongoDB 資料庫工具是用於處理 MongoDB 部署的命令行實用程式的集合。資料庫工具包括以下二進位文件:

  • 二進位導入導出
    • mongodump: 導出 mongod 資料庫的二進位數據
    • mongorestore: 恢復 mongodump 導出文件的數據到 mongod 或 mongos 資料庫
    • bsondump: 轉換 BSON 導出文件成 JSON 格式
  • 數據導入導出
    • mongoimport: 從外部 JSON、CSV 或 TSV 文件中載入數據
    • mongoexport: 從 mongod 實例中導出數據到 JSON 或 CSV 文件中
  • 診斷工具
    • mongostat: 快速診斷當前運行的 mongod 或 mongos 實例的狀態
    • mongotop: 統計 mongod 實例讀取和寫入數據的時間
  • GridFS 工具
    • mongofiles: 支持在 GridFS 對象中操作 MongoDB 實例中存儲的文件

數據邏輯結構

MongoDB 數據邏輯結構分為資料庫 database、集合 collection、文檔 document 三層 :

  • 一個 mongod 實例中允許創建多個資料庫
  • 一個資料庫中允許創建多個集合,集合相當於關係型資料庫的表
  • 一個集合則是由若幹個文檔構成,文檔相當於關係型資料庫的行,是 MongoDB 中數據的基本單元

資料庫

一個資料庫中可以創建多個集合,原則上應把邏輯相近的集合都放在一個資料庫中。

在 MongoDB 中,會有以下幾個內建的資料庫:

  • admin: 存放有資料庫帳號相關信息,在身份驗證和授權時使用
  • local: 特定於單個伺服器的數據會存儲在此資料庫中。在副本集中,local 資料庫用於存儲複製過程中所使用的數據,而其本身不會被覆制。
  • config: 用於分片集群環境,存放了分片相關的元數據信息
  • test: 預設創建的測試庫,連接 mongod 服務時,如果不指定連接的具體資料庫,預設就會連接到 test 資料庫

集合

和 SQL 的表不同,集合是動態模式,不需要在讀寫數據前創建模式就可以使用,集合中的文檔也可以擁有不同的欄位,隨時可以任意增減某個文檔的欄位。

預設情況下,集合不要求其文檔具有相同的模式,但這是一種很好的實踐。可以通過使用 MongoDB 的文檔驗證功能和可用於多種編程語言的對象–文檔映射(object-document mapping)庫來實現文檔驗證。

集合由其名稱進行標識,集合名稱可以是任意 UTF-8 字元串,但有以下限制:

  • 不能是空字元串("")。
  • 不能含有 \0(空字元),這個字元用於表示集合名稱的結束
  • 不能以 system. 開頭,該首碼為內部集合保留

集合名稱使用 . 字元可以創建子集合,用與區分不同組織集合。雖然子集合沒有任何特殊屬性,但它們很有用,許多 MongoDB 工具整合了子集合。

文檔

文檔是 MongoDB 中數據的基本存儲單元,以一種叫作 BSON 的文檔結構表示。

文檔中的鍵值對是有序的,不同序則是不同文檔。並且鍵是區分大小寫的,否則也為不同文檔。

文檔的鍵是字元串,而值除了字元串,還可以是 IntLongDoubleBoolean、數組、嵌入文檔等多種類型。

每個文檔都有一個預設的 _id 鍵,它相當於關係型資料庫中的主鍵,這個鍵的值在同一個集合中必須是唯一的。

_id 鍵的值預設是 ObjectId 類型,在插入文檔的時候,如果用戶不設置文檔的 _id 值的話,MongoDB 會自動生成一個唯一的 ObjectId 值進行填充。

資料庫文件

MongoDB 在 3.2 版本已經將 WiredTiger 作為預設的存儲引擎。其作為存儲引擎的時候,資料庫會有以下存儲文件:

  • collection-*.wt: 存儲集合的數據
  • index-*.wt: 存儲索引的數據
  • WiredTiger: 存儲基本配置信息
  • WiredTiger.wt: 存儲所有其他集合的元數據信息
  • WiredTiger.lock: 存儲進程 ID,用於防止多個進程連接同一個 WiredTiger 資料庫
  • WiredTiger.turtle: 存儲 WiredTiger.wt 的元數據信息
  • journal: 存儲資料庫的寫日誌

命令行工具

MongoDB 提供的 mongosh 是一個 JavaScript 的 shell,其提供了許多高級功能和自定義功能。

使用技巧

對於 MongoDB 提供的功能,shell 內置了幫助文檔,可以輸入 help 命令進行訪問,使用 db.help() 可以查看資料庫級別的幫助文檔,使用 db.foo.help() 可以查看集合級別的幫助文檔。

在 shell 中使用函數之前,在不使用括弧的情況下輸入函數名,這樣會列印出函數的源代碼,這是一個可以查看函數具體行為的好方法。

執行腳本

shell 不止可以直接執行 JavaScript 的腳本代碼,還可以用於執行 JavaScript 的腳本文件,簡單執行 mongo script.js 即可。

如果已經進入到 shell 中,可以使用 load() 函數載入 JavaScript 腳本文件。

創建 .mongorc.js 文件

對於需要頻繁被載入的腳本,可以將它們添加到 .mongorc.js 中,此文件會在啟動 shell 時自動運行。

在更實際一些的場景中,使用此腳本可以設置全局變數,或者為長名稱設置一個簡短的別名,也可以重寫內置函數。

定製提示信息

通過將 prompt 變數設置為一個字元串或函數,可以重寫預設的 shell 提示,如下示例:

prompt = function() {
    if (typeof db == 'undefined') {
        return '(nodb)> ';
    }

    // 檢查最後的資料庫操作
    try {
        db.runCommand({getLastError: 1});
    } catch (e) {
        print(e);
    }

    return db+"> ";
};

提示函數應該返回一個字元串,通常應該包含對 getLastError 的調用,這樣可以捕獲輸入時的錯誤,併在 shell 斷開連接時自動重新連接。

編輯複雜變數

使用 shell 時,編輯多行的時候不能再編輯前面的行,這對於較大的代碼塊或對象非常不友好。

為此,可以在 shell 中設置 EDITOR 變數,則可以使用 edit varname 的方式編輯一個變數,完成更改後只需保存並退出編輯器,變數將被重新解析並載入回 shell 中。

不便使用的集合名稱

大多數情況下可以使用 db.collectionName 語法來獲得一個集合的內容,但如果集合名稱是保留字或是無效的 JavaScript 屬性名稱時,那麼此方法就不能正常工作了。

對於上述的情況,可以使用 db.getCollection() 的方式繞過無效屬性。

首發於翔仔的個人博客,點擊查看更多。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、Installing RabbitMQ-3.10.2 on CentOS 7.9 1 地址 https://www.rabbitmq.com https://github.com/rabbitmq/rabbitmq-server https://github.com/rabbitmq/rabbi ...
  • ElasticSearch 常見問題 丈夫有淚不輕彈,只因未到傷心處。 1、說說 es 的一些調優手段。 僅索引層面調優手段: 1.1、設計階段調優 (1)根據業務增量需求,採取基於日期模板創建索引,通過 roll over API 滾動索引; (2)使用別名進行索引管理; (3)每天凌晨定時對索引 ...
  • 首發微信公眾號:SQL資料庫運維 原文鏈接:https://mp.weixin.qq.com/s?__biz=MzI1NTQyNzg3MQ==&mid=2247485212&idx=1&sn=450e9e94fa709b5eeff0de371c62072b&chksm=ea37536cdd40da7 ...
  • 簡述 CloudCanal除了提供最核心的數據遷移和同步能力以外,還提供數據校驗和數據訂正兩種非常實用的能力。這兩種功能為用戶保障數據遷移同步鏈路的數據質量提供了非常大的便利性。例如對端資料庫因為各種原因產生一些異常寫入導致的數據不一致或者丟失,用戶均可以使用CloudCanal提供的數據校驗和數據 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 好好先生 一、問題引入 今天遇到一個很奇怪的問題,在MySQL客戶端輸入,用不同科學計數法表示的數值,展示效果卻截然不同: mysql> sel ...
  • 項目中需要計算使用年限,按月份算。剛開始踩了坑,不足1年應該按1年算。記錄下~ 和當前時間比較,用DATEDIFF函數DateDiff(month,比較的時間,getdate())先算出月份,再除以12算年份 查看代碼 --月份差值 2.083333 select CONVERT(decimal,D ...
  • 11月11日,騰訊雲資料庫與金蝶雲 · 蒼穹發佈“國產資料庫聯合解決方案”,騰訊雲資料庫全面支持蒼穹平臺的技術與應用設計,通過一體化的“PaaS+SaaS”解決方案,一站式解決企業國產化難題,最高可支持億級賬戶規模量與日均億級交易處理。 目前,騰訊雲資料庫TDSQL和金蝶雲 · 蒼穹PaaS平臺已完 ...
  • 摘要:目前Hudi只支持FlinkSQL進行數據讀寫,但是在實際項目開發中一些客戶存在使用Flink DataStream API讀寫Hudi的訴求。 本文分享自華為雲社區《FusionInsight MRS Flink DataStream API讀寫Hudi實踐》,作者: yangxiao_mr ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...