一、特點 學習一個東西,至少首先得知道它能做什麼?適合做什麼?有什麼優缺點吧? 傳統關係型資料庫,遵循三大範式。即原子性、唯一性、每列與主鍵直接關聯性。但是後來人們慢慢發現,不要把這些數據分散到多個表、節點或實體中,將這些信息收集到一個非規範化(也就是文檔)的結構中會更有意義。儘管兩個或兩個以上的文 ...
一、特點
學習一個東西,至少首先得知道它能做什麼?適合做什麼?有什麼優缺點吧?
傳統關係型資料庫,遵循三大範式。即原子性、唯一性、每列與主鍵直接關聯性。但是後來人們慢慢發現,不要把這些數據分散到多個表、節點或實體中,將這些信息收集到一個非規範化(也就是文檔)的結構中會更有意義。儘管兩個或兩個以上的文檔有可能會彼此產生關聯,但是通常來講,文檔是獨立的實體。能夠按照這種方式優化並處理文檔的資料庫,我們稱之為文檔資料庫。
設計MongoDB的初衷就是用作分散式資料庫。
MongoDB 的優點:
1、性能優越。MongoDB在各方面的設計都旨在保持它的高性能,MongoDB能對文檔進行動態填充(dynamic padding),也能預分配數據文件以利用額外的空間來換取穩定的性能。MongoDB把儘可能多的記憶體用作緩存(cache),試圖為每次查詢自動選擇正確的索引。
2、豐富的數據類型。採用BSON形式存儲。幾乎你想要的數據類型是怎麼樣的,存在Mongo裡面就會是什麼樣的。避免像關係型數據那樣分table,然後使用的時候再join。
3、易於擴展。MongoDB的設計採用橫向擴展。面向文檔的數據模型使它能很容易地在多台伺服器之間進行數據分割。MongoDB能自動處理跨集群的數據和負載,自動重新分配文檔,以及將用戶請求路由到正確的機器上。
MongoDB 的缺點:
1、不支持事務。MongoDB 犧牲了資料庫的事務性以追求性能的提升。
2、無法進行關聯操作。不適用於關係複雜的數據。
應用場景 :主要解決海量數據的訪問效率問題。適合進行大數據存儲,而且數據的更新和刪除儘可能少(避免造成磁碟碎片)。比如我們公司的系統用它來存儲司機的定位點信息,15秒上傳一次,自定義的BSON 格式,後期主要是查詢相關數據,修改較少。
二、基礎知識
1、文檔
文檔是MongoDB的核心概念,文檔就是鍵值對的一個有序集。
文檔的鍵是字元串;不能含有\0(空字元),這個字元用於表示鍵的結尾;不能使用系統保留的 . 和 $;鍵不能重覆。
文檔的值可以是任意的MongoDB支持的類型。
MongoDB的鍵值對不但區分類型,而且區分大小寫,並且是有序的。"3" 和 3 表示不同的值。"foo" 和 "Foo"表示不同的值。{"x" : 1, "y":2}與{"y": 2, "x": 1}是不同的。
2、集合
集合就是一組文檔。如果把MongoDB的一個文檔比喻成關係資料庫中的一行,那麼一個集合就相當於一張表。不同於表的是,一個集合裡面的文檔可以是各式各樣的,例如,下麵兩個文檔可以存儲在同一個集合裡面:
{"greeting" : "Hello, world!"}
{"foo" : 5}
儘管如此,從開發、管理以及後面的優化來考慮還是不贊同將各式各樣的文檔不加區分地放在一個集合里。強烈建議把相關類型的文檔組織在一起!
組織集合的一種慣例是使用 " . " 分隔不同命名空間的子集合。例如,一個具有博客功能的應用可能包含兩個集合,分別是blog.posts和blog.authors。這是為了使組織結構更清晰,這裡的blog集合(這個集合甚至不需要存在)跟它的子集合沒有任何關係。
在MongoDB中,使用子集合來組織數據非常高效,值得推薦。
3、資料庫
在MongoDB中,多個文檔組成集合,而多個集合可以組成資料庫。
要記住一點,資料庫最終會變成文件系統里的文件,而資料庫名就是相應的文件名,所以資料庫名有諸多限制。
系統預留資料庫:
- admin
從身份驗證的角度來講,這是“root”資料庫。如果將一個用戶添加到admin資料庫,這個用戶將自動獲得所有資料庫的許可權。再者,一些特定的伺服器端命令也只能從admin資料庫運行,如列出所有資料庫或關閉伺服器。
- local
這個資料庫永遠都不可以複製,且一臺伺服器上的所有本地集合都可以存儲在這個資料庫中
- config
MongoDB用於分片設置時,分片信息會存儲在config資料庫中。
4、數據類型
MongoDB在保留JSON基本鍵/值對特性的基礎上,添加了一些數據類型。
- null
--表示空值或者不存在的欄位
- boolean
-- 布爾類型有兩個值true和false
- 數值
-- shell 預設使用64位浮點型數值。可使用NumberInt類(表示4位元組帶符號整數)或NumberLong類(表示8字元帶符號整數)
-- {"x" : NumberInt("3")}
-- {"x" : NumberLong("3")}
- 字元串
- 日期
-- 日期存儲為新紀元以來經過的毫秒數,不存儲時區。
- 數組
-- 數組可以包含不同數據類型的元素
- 對象(內嵌文檔)
-- {"x" : {"foo" : "bar"}}
- 對象id
-- 對象id是一個12位元組的ID,是文檔的唯一標識。
-- {"x" : ObjectId()}
- 二進位數據
-- 如果要將非UTF- 8字元保存到資料庫中,二進位是唯一的方式
- 代碼
-- 查詢和文檔中可以包括任意JavaScript代碼
-- {"x" : function() { /* ... */ }}
三、創建、更新和刪除文檔
1、插入(insert)
插入單條:db.foo.insert({"bar" : "baz"})
批量插入:db.foo.batchInsert([{"_id" : 0}, {"_id" : 1}, {"_id" : 2}])
當前版本的MongoDB能接受的最大消息長度是48 MB,所以在一次批量插入中能插入的文檔是有限制的。如果試圖插入48 MB以上的數據,多數驅動程式會將這個批量插入請求拆分為多個48 MB的批量插入請求。
如果在執行批量插入的過程中有一個文檔插入失敗,那麼在這個文檔之前的所有文檔都會成功插入到集合中,而這個文檔以及之後的所有文檔全部插入失敗。
2、刪除(remove)
db.foo.remove()
--會刪除foo集合中的所有文檔。但是不會刪除集合本身,也不會刪除集合的元信息。接受一個查詢文檔作為可選參數。
db.foo.drop()
--整個集合都被刪除,所有元數據也都不見。
$pop(針對數組)
-- $pop 可以從數組任何一端刪除元素。
{"$pop":{"key":1}} 從數組末尾刪除一個元素
{"$pop":{"key":-1}} 則從頭部刪除。
$pull(針對數組)
-- $pull 刪除數組中滿足條件的元素。
-- db.lists.update({}, {"$pull" : {"todo" : "laundry"}}) 將數組中 todo鍵 等於 laundry 的元素全部剔除掉。即 數組中不會有 "todo" : "laundry" 這個鍵值對了。
3、修改(update)
db.collection.update(
<query>,
<update>,
upsert: <boolean>,
multi: <boolean>,
writeConcern: <document>
)
update有兩個必選參數,一個是查詢文檔,用於定位需要更新的目標文檔;另一個是修改器文檔,用於說明要對找到的文檔進行哪些修改。
update 有三個可選參數,upsert : 可選,這個參數的意思是,如果不存在update的記錄,是否插入objNew,true為插入,預設是false,不插入。multi : 可選,mongodb 預設是false,只更新找到的第一條記錄,如果這個參數為true,就把按條件查出來多條記錄全部更新。writeConcern :可選,拋出異常的級別。
MongoDB的修改、刪除、保存都是原子性的。更新操作是不可分割的:若是兩個更新同時發生,先到達伺服器的先執行,接著再執行另外一個。所以文檔的最終結果取決於最後時間執行的更新操作。
$inc
db.analytics.update({"url" : "www.example.com"},{"$inc" : {"pageviews" : 1}})
-- 匹配到 url 等於 www.example.com 的文檔,將它的欄位pageviews 加1
-- $inc 只能用於整型、長整型或 雙精度浮點型的值。
$set
-- $set 用來指定一個欄位的值,如果這個欄位不存在,則創建它。
db.users.update({"_id" : ObjectId("4b253b067525f35f94b60a31")},{"$set" : {"favorite book" : "War and Peace"}})
-- $set 甚至可以修改鍵的類型。
db.users.update({"name" : "joe"},{"$set" : {"favorite book" :["Cat's Cradle", "Foundation Trilogy", "Ender's Game"]}})
-- $unset 將一個鍵完成刪除
db.users.update({"name" : "joe"},{"$unset" : {"favorite book" : 1}})
$push (針對數組)
-- 如果數組已經存在,$push 會向已有的數組末尾加入一個元素,要是沒有就創建一個新的數組。
db.blog.posts.update(
{"title" : "A blog post"},
{"$push" :
{"comments" :{"name" : "bob", "email" : "[email protected]","content" : "good post."}}
})
-- 使用 $each 操作符,可以通過$push 操作添加多個值。
db.blog.posts.update(
{"title" : "A blog post"},
{"$push" :
{"comments" : $each:[
{"name" : "bob", "email" : "[email protected]","content" : "good post."},
{"name" : "job", "email" : "[email protected]","content" : "job post."}]}
})
$addToSet(針對數組)
-- $addToSet添加值到一個數組中去,如果數組中已經存在該值那麼將不會有任何的操作。
db.users.update({"_id" : ObjectId("4b2d75476cc613d5ee930164")},{"$addToSet" : {"emails" : "[email protected]"}})
4、保存(save)
save是一個shell函數,如果文檔不存在,它會自動創建文檔;如果文檔存在,它就更新這個文檔。它只有一個參數:文檔。要是這個文檔含有"_id"鍵,save會調用upsert。否則,會調用insert。
5、findAndModify
findAndModify 可以在一個操作中返回匹配結果併進行更新。這對於操作隊列 以及 執行其他需要進行原子性取值 和賦值的操作來說,十分方便。
findAndModify命令有很多可以使用的欄位:
- findAndModify --字元串,集合名。
- query --查詢文檔,用於檢索文檔的條件。
- sort --排序結果的條件。
- update --修改器文檔,用於對匹配的文檔進行更新(update和remove必須指定一個)。
- remove --布爾類型,表示是否刪除文檔(remove和update必須指定一個)。
- new --布爾類型,表示返回更新前的文檔還是更新後的文檔。預設是更新前的文檔。
- fields --文檔中需要返回的欄位(可選)。
- upsert --布爾類型,值為true時表示這是一個upsert。預設為false。
db.runCommand({"findAndModify" : "processes",
"query" : {"status" : "READY"},
"sort" : {"priority" : -1},
"update" : {"$set" : {"status" : "RUNNING"}}})
db.runCommand({"findAndModify" : "processes",
"query" : {"status" : "READY"},
"sort" : {"priority" : -1},
"remove" : true})