MongoDB學習七--MongoDB高級操作

今天學習了mongodb中比較好玩的知識,主要包括:聚合,遊標。

聚合

常見的聚合操作跟sql server一樣,有:count,distinct,group,mapReduce。

1,count是最簡單,最容易,也是最常用的聚合工具,跟sql語句相差不大


> db.person.count()

4
> db.person.count({"age":"28"})
2

2,distinct查出不重複的值

> db.person.distinct({"age"})
2015-08-24T19:19:25.264+0800 E QUERY    SyntaxError: Unexpected token }
> db.person.distinct("age")
[ "20", "23", "28" ]

3,在mongodb裏面做group操作有點小複雜,不過大家對sql server裏面的group比較熟悉的話還是一眼能看的明白的,其實group操作本質上形成了一種“k-v”模型。

  下面舉的例子就是按照age進行group操作,value爲對應age的姓名。下面對這些參數介紹一下:
  key:  這個就是分組的key,我們這裏是對年齡分組。
  initial: 每組都分享一個”初始化函數“,特別注意:是每一組,比如這個的age=20的value的list分享一個initial函數,age=22同樣也分享一個initial函數。
  $reduce: 這個函數的第一個參數是當前的文檔對象,第二個參數是上一次function操作的累計對象,第一次爲initial中的{”perosn“:[]}。有多少個文檔, $reduce就會調用多少次。

> db.person.group({
... "key":{"age":true},
... "initial":{"person":[]},
... "$reduce":function(cur,prev){
... prev.person.push(cur.name);
... }
... })
[
{
"age" : "20",
"person" : [
"jack"
]
},
{
"age" : "23",
"person" : [
"jack zhang"
]
},
{
"age" : "28",
"person" : [
"jack Ma",
"Lucy"
]
}
]

看到上面的結果,是不是有點感覺,我們通過age查看到了相應的name人員,不過有時我們可能有如下的要求:
     ①:想過濾掉age>27一些人員。
     ②:有時person數組裏面的人員太多,我想加上一個count屬性標明一下。
 針對上面的需求,在group裏面還是很好辦到的,因爲group有這麼兩個可選參數: condition 和 finalize。
     condition:  這個就是過濾條件。
     finalize:這是個函數,每一組文檔執行完後,多會觸發此方法,那麼在每組集合裏面加上count也就是它的活了。

> db.person.find({"age":{$gt:20}})
{ "_id" : ObjectId("55db0437eddcc2232489cb53"), "name" : "LiLei zhang", "age" : 23, "address" : "ShangHai" }
{ "_id" : ObjectId("55db0440eddcc2232489cb54"), "name" : "Lucy zhang", "age" : 23, "address" : "ShangHai" }
{ "_id" : ObjectId("55db0450eddcc2232489cb55"), "name" : "Lily zhang", "age" : 26, "address" : "BJ" }
{ "_id" : ObjectId("55db045aeddcc2232489cb56"), "name" : "Jack zhang", "age" : 26, "address" : "SZ" }
{ "_id" : ObjectId("55db0468eddcc2232489cb57"), "name" : "Mathew zhang", "age" : 28, "address" : "SZ" }
{ "_id" : ObjectId("55db0470eddcc2232489cb58"), "name" : "Deth zhang", "age" : 28, "address" : "SZ" }

先按條件查出所有,再按條件分組

db.person.group({ "key":{"age":true}, "initial":{"person":[]}, "$reduce":function(doc,out){ out.person.push(doc.name); }, "finalize":function(out){ out.count=out.person.length; }, "condition":{"age":{$lt:28}} })
[
{
"age" : 23,
"person" : [
"LiLei zhang",
"Lucy zhang"
],
"count" : 2
},
{
"age" : 26,
"person" : [
"Lily zhang",
"Jack zhang"
],
"count" : 2
}
]

4,mapReduce這玩意算是聚合函數中最複雜的了,不過複雜也好,越複雜就越靈活。mapReduce其實是一種編程模型,用在分佈式計算中,其中有一個“map”函數,一個”reduce“函數。
① map:這個稱爲映射函數,裏面會調用emit(key,value),集合會按照你指定的key進行映射分組。
② reduce:這個稱爲簡化函數,會對map分組後的數據進行分組簡化,注意:在reduce(key,value)中的key就是emit中的key,vlaue爲emit分組後的emit(value)的集合,這裏也就是很多{"count":1}的數組。
③ mapReduce:這個就是最後執行的函數了,參數爲map,reduce和一些可選參數。具體看圖可知:

> var map= function() {
... emit(this.name, this.age);
... }
> var reduce= function(key,value) {
... return Array.sum(value);
... }
> db.person.mapReduce(
... map,
... reduce,
... { out: "map_reduce_person" }
... )
{
"result" : "map_reduce_person",
"timeMillis" : 33,
"counts" : {
"input" : 6,
"emit" : 6,
"reduce" : 0,
"output" : 6
},
"ok" : 1
}

從圖中我們可以看到如下信息:
result: "存放的集合名“;
input:傳入文檔的個數。
emit:此函數被調用的次數。
reduce:此函數被調用的次數。
output:最後返回文檔的個數。

遊標

mongodb裏面的遊標有點類似我們說的C#裏面延遲執行,比如:
var list=db.person.find();
針對這樣的操作,list其實並沒有獲取到person中的文檔,而是申明一個“查詢結構”,等我們需要的時候通過for或者next()一次性加載過來,然後讓遊標逐行讀取,當我們枚舉完了之後,遊標銷燬,之後我們在通過list獲取時,發現沒有數據返回了。

> var list=db.person.find();
> list.forEach(function(x){
... print(x.name);
... })
LiLei zhang
Lucy zhang
Lily zhang
Jack zhang
Mathew zhang
Deth zhang
當然我們的“查詢構造”還可以搞的複雜點,比如分頁,排序都可以加進去。
 var single=db.person.find().sort({"name",1}).skip(2).limit(2);
那麼這樣的“查詢構造”可以在我們需要執行的時候執行,大大提高了不必要的花銷。

> var single=db.person.find().sort({"name":1}).skip(2).limit(3)
> single
{ "_id" : ObjectId("55db0437eddcc2232489cb53"), "name" : "LiLei zhang", "age" : 23, "address" : "ShangHai" }
{ "_id" : ObjectId("55db0450eddcc2232489cb55"), "name" : "Lily zhang", "age" : 26, "address" : "BJ" }
{ "_id" : ObjectId("55db0440eddcc2232489cb54"), "name" : "Lucy zhang", "age" : 23, "address" : "ShangHai" }


發佈了32 篇原創文章 · 獲贊 14 · 訪問量 17萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章