MongoDB的一些高級語法 AND 和 OR操作 AND操作 OR操作 嵌入式文檔 插入 查詢 數組(Array)欄位 插入 查詢 聚合(Aggregation) 篩選數據 修改欄位 註意事項 包括現有欄位 取消_id欄位 排除欄位 分組操作 去重 分組操作運算 拆分數組 聯集合查詢 參考資料 M ...
MongoDB的一些高級語法
在前面的博客中,我們瞭解一些Mongodb中最基礎的用法,只介紹了簡單的增刪查改,在這篇博客中,我將介紹一下稍微複雜一點的語法。
AND 和 OR操作
AND操作
在前面的博客中,我們介紹了查找命令,其中可以指令多個查詢條件,當所有條件都符合時,就可以查詢到數據。那麼,如果我們只想只要有一個條件符合,就返回想要的數據,那麼我們應該怎麼做呢?
db.getCollection('test_data_1').find({"欄位1":"固定值1","欄位2":"固定值2"})
在上面的命令中,實際上是一個隱式的AND,因為需要同時滿足。但是又沒有出現AND這個關鍵詞,所以被稱為“隱式AND操作”。下麵,就讓我們來將隱式轉為顯式,只需要使用“$and”即可。
db.getCollection('test_data_1').find(
{
"$and":[
{"欄位1":"固定值1"},
{"欄位2":"固定值2"}
]
}
)
OR操作
or操作就是為了查詢只符合其中任一條件的數據。命令語法和顯式的AND操作一樣。
db.getCollection('test_data_1').find(
{
"$or":[
{"欄位1":"固定值1"},
{"欄位2":"固定值2"}
]
}
)
其中,我們需要知道,儘管存在隱式的AND操作,但是,對於OR操作來說,不存在隱式的OR操作。 同時or操作時會遵循一個"短路原則":只要前面的條件滿足了,那後面的條件直接跳過(類似編程中的||)。
嵌入式文檔
下麵便是一個嵌入式文檔的例子:
我們可以看到在studyInfo中,還有著score和project。其中,studyInfo被稱為嵌入式文檔,studyInfo下麵的欄位被稱為嵌套欄位
插入
下麵是一個插入語句的示例。
db.getCollection('test_data_1').insertOne(
{
"age":18,
"adress":"Hunan",
"studyInfo":{
"score":59,
"project":"LOL"
}
}
)
查詢
查詢語句
如果我們需要根據嵌入式文檔中的嵌套欄位的條件去查詢,那麼下麵這樣使用就行了。如果嵌套欄位裡面還有嵌入式文檔,一路點點點過去就行了。
db.getCollection('test_data_1').find(
{
"studyInfo.score":59
},
// 不返回studyInfo.score
{
"studyInfo.score":0
}
)
數組(Array)欄位
插入
在下麵中,like欄位保存的就是一個數組,所以我們使用**[]**將"apple","orange","fruit"括起來。
db.getCollection('test_data_1').insertOne(
{
"name":"Array",
"like":["apple","orange","fruit"]
}
)
使用Robo3T可視化工具查看,顯示如下:
1566638722008
查詢
其中,like的類型為Array。但是如果我們查詢的時候需要根據like中某個值作為篩選目標的時候,我們怎麼辦呢?我們無需進行其他任何操作(和以前的查詢一模一樣)。例如查詢所有喜歡orange的人:
db.getCollection('test_data_1').find({"like":"orange"})
也就是說它的查詢與以前沒有任何區別。但是,既然是數組,總有一定其他的操作,例如查詢欄位數組為長度的記錄:
db.getCollection('test_data_1').find({"like":{"$size":3}})
上面是查詢like欄位的數組長度為3的記錄。
註意:“$size”只能查詢某一個具體長度的數組,而不能查詢範圍,如果進行範圍查詢的話,會報錯:
當然,既然有數組,那麼必然會有索引,在mongodb中,數組的第一個元素的索引為0,和大部分的編程的情況是一樣的。
我們可以通過“欄位名.索引”來定位元素。例如查詢:
db.getCollection('test_data_1').find(
{
"like.0":"apple"
}
)
聚合(Aggregation)
聚合的功能很簡單,就是讓Mongodb來處理數據,然後返回被處理好的數據。
聚合的操作命令是“aggregation”,基本格式是:
db.getCollection('test_data_1').aggregation([階段1,階段2,階段3……])
集中,階段可以為零個(那麼就相當於findi命令),也可以為任意數量。其中,階段中間有點類似linux或者unix中的管道
img
也就是說,前面一個階段的輸出,是後面一個結點的輸入。
下麵是來自菜鳥教程的一些關鍵字的用法。
- $project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。
- $match:用於過濾數據,只輸出符合條件的文檔。$match使用MongoDB的標準查詢操作。
- $limit:用來限制MongoDB聚合管道返回的文檔數。
- $skip:在聚合管道中跳過指定數量的文檔,並返回餘下的文檔。
- $unwind:將文檔中的某一個數組類型欄位拆分成多條,每條包含數組中的一個值。
- $group:將集合中的文檔分組,可用於統計結果。
- $sort:將輸入文檔排序後輸出。
- $geoNear:輸出接近某一地理位置的有序文檔。
下麵我將在一些數據的處理方面來介紹一下其中的一些命令。
篩選數據
篩選數據的功能乍一看和find的功能差不多,然後仔細一看,還真的和find的功能一模一樣。篩選數據的關鍵字是“ $match”
db.getCollection('test_data_1').aggregate([{"$match":{和find完全一樣的過濾表達式}}])
下麵是返回like欄位數組的第一個元素為“apple”的記錄(和上面數組欄位裡面查詢返回的結果一模一樣)。
db.getCollection('test_data_1').aggregate([{"$match":{"like.0":"apple"}}])
那麼,這樣做有什麼意義呢?返回的結果和find的命令一樣,還比find麻煩,這樣做豈不是多此一舉。的確,如果我們僅僅這樣做,還不如使用find,它的強大之處在於與其他關鍵字進行組合。因為進行數據處理,一般第一步都是進行篩選。
修改欄位
前面我們介紹了$project的介紹,那麼修改欄位我們將使用$projecto來操作。
$project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。
正如上面所介紹的,$project的功能很強大,可以做到很多事情。
-
修改返回的欄位
下麵返回的欄位中不包含_id和like 欄位
db.getCollection('test_data_1').aggregate([ {"$project":{"_id":0,"like":0}} ])
下麵是結合$match的使用,其中前面的$match的返回的輸出是$project的輸入
db.getCollection('test_data_1').aggregate([ {"$match":{"like":{"$size":3}}}, {"$project":{"_id":0,"like":0}} ])
這個的作用也和find中的返回返回部分欄位的操作差不多,這個操作沒有什麼讓人新奇的地方,下麵將介紹它的其他強大之處。
註意事項
包括現有欄位
_id
欄位預設包含在輸出文檔中。- 如果指定包含文檔中不存在的欄位, $project 將忽略該欄位包含,並且不會將該欄位添加到文檔中。
取消_id欄位
- 預設情況下,
_id
欄位包含在輸出文檔中。要從輸出文檔中排除_id
欄位,必須在 $project 中明確指定對_id
欄位的抑制。
排除欄位
-
如果指定排除某個或多個欄位,則在輸出文檔中返回所有其他欄位。
-
如果指定排除
_id
以外的欄位,則不能使用任何其他 $project 規範表單:即,如果排除欄位,則不能指定包含欄位,重置現有欄位的值或添加新欄位。
-
添加新的欄位
如果我想返回的結果中添加新的欄位,怎麼辦?在project中直接添加就行
db.getCollection('test_data_1').aggregate([ {"$project":{ "name":1, "_id":0, // 添加的新的欄位 "add":"GG" } } ])
不過值得註意的是:
如果指定排除
_id
以外的欄位,則不能使用任何其他 $project 規範表單:即,如果排除欄位,則不能指定包含欄位,重置現有欄位的值或添加新欄位。也就是說,如果排除了除“_id”以外的欄位,那麼,就GG了。就沒辦法添加欄位了。
並且值得註意的是,添加新的欄位的時候,如果舊的欄位不設置為1,則不會返回。(也就是說,如果添加了新的欄位,想要返回本來存在欄位,必須將欄位設置為1)
-
重命名欄位
重命名欄位和添加新的欄位差不多,簡單點來說,我們可以使用“$舊的欄位名”來表示欄位的數據。示例如下
db.getCollection('test_data_1').aggregate([ {"$project":{ // 添加新的欄位,新的欄位的數據是name欄位的數據 "add":"$name" } } ])
結果如下:
這個對於嵌套文檔有著非常好的效果,可以看下麵的兩個例子
使用find 使用聚合
-
處理特殊字元
這裡有說兩個問題,如果我需要修改一個欄位的數據為1,或者為$project呢?可以知道,這些值與mongodbe自身的語法衝突了(所有以“$”開頭的普通字元串和數字都不能添加)。這個時候我們可以使用" $literal"關鍵字。
分組操作
分組操作所對應的關鍵字是“$group”,它的作用是根據給出的欄位key,它所有的key的值相同的記錄放在一起進行運算。
去重
在上一篇博客中使用了去重函數“distinct”,使用該函數後,返回的是一個數組。不過,現在我們可以使用“$group”去重。操作如下所示:
db.getCollection('test_data_1').aggregate(
[
{
"$group":{"_id":"$被g去重的欄位名"}
}
]
)
其中,“_id”是必不可少的,不能用其他的去替代。而這個返回的也不是一個數組,而是很多條記錄。
分組操作運算
首先先說一下運算的關鍵字,關鍵字包括(來自菜鳥教程):
表達式 | 描述 | 實例 |
---|---|---|
$sum | 計算總和。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 計算平均值 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 獲取集合中所有文檔對應值得最小值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 獲取集合中所有文檔對應值得最大值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 在結果文檔中插入值到一個數組中。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 在結果文檔中插入值到一個數組中,但不創建副本。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根據資源文檔的排序獲取第一個文檔數據。 | db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$last | 根據資源文檔的排序獲取最後一個文檔數據 | db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}]) |
大家看那個實例估計也明白怎麼操作了。首先我們先去重,然後再指定名字,最後進行計算:
計算的方法:{$關鍵字:$已有的欄位名}
下麵便是計算age的平均值,然後以“aver_age”返回。
原則上,“$sum”和“$avg”的值對應的值應該是數字,如果使用非數字,則“$sum”會返回0,“$avg”會返回“null”。註意,字元串是可以比較大小的。其中,“$sum”的值還可以使用數字“1”,例如
"count":{"$sum":1}
,則返回的就是每個分組有多少條記錄。
拆分數組
拆分數組使用的關鍵字是“$unwind”,它的作用是把一條包含數組的記錄拆分為很對條記錄,其中,每一條記錄擁有數組中的一個元素。
下麵是數組like和infos進行拆分,其中拆分的結果數量是like數組的長度乘以infos數組的長度。
db.getCollection('test_data_1').aggregate(
[
{"$unwind":"$like"},
{"$unwind":"$infos"},
]
)
聯集合查詢
Mongodb中的聯集合查詢類似SQL中的聯表查詢,在聯集合查詢中,有兩個概念,主集合和被查集合。簡單點來說,就是主集合提供欄位key,然後被查集合通過欄位key查出需要的欄位。
db.getCollection('主集合名').aggregate([
"$lookup":{
"from":"被查集合名",
"localField":"主集合提供的欄位key",
"foreginField":"被查集合接受的欄位",
"as":"為查出來的欄位命名",
}
]
)
下麵是兩個文檔,一個為user,一個為login
現在我們通過login中的id從user中拿出欄位:
db.getCollection('login').aggregate([
{ "$lookup":{
"from":"user",
"localField":"loginId",
"foreignField":"id",
"as":"login_name",
}
}
]
)
返回結果如下:
其中,login_name為聯結合查出來的數據,為一個數組。
當然,對於這個結果的樣式我們是不太滿意的,因為我我們只想拿出name,這個時候我們就需要使用前面的知識來解決這個問題了。
db.getCollection('login').aggregate([
{ "$lookup":{
"from":"user",
"localField":"loginId",
"foreignField":"id",
"as":"login_name",
}
}, {
"$unwind":"$login_name"
},
{
"$project":{
"_id":0,
"loginId":1,
"name":"$login_name.name"
}
}
])
返回的結果如圖所示:
參考資料
參考書籍:《左手Mongodb,右手Redis》
菜鳥教程:https://www.runoob.com/mongodb/mongodb-tutorial.html
docs4dev:https://www.docs4dev.com/docs/zh/mongodb/v3.6/reference