一、取得集合的數據量

範例：統計students表中的數據量

db.students.count();

範例：模糊查詢

db.students.count({"name":/xie/i});

在進行數據查詢的時候，不設置條件永遠要比設置條件的查詢快很多，也就是說在之前的代碼編寫裏面不管是查詢全部還是模糊查詢，實際上最終都是使用的模糊查詢一種（只是沒有設置關鍵字）。

二、消除重複數據(此功能意義不大）

範例：查詢所有name的信息

本次的操作沒有直接的函數支持，只能夠利用runCommand()函數。

db.runCommand({"distinct":"students1","key":"name"});

此時實現了對於name數據的重複值的篩選。

三、group操作

使用“group”操作可以實現數據的分組操作，在MongoDB裏會將集合一句指定的key的不同進行分組操作，並且每一個組都會產生一個處理的文檔結果。

範例：查詢所有年齡大於等於19歲的學生信息，並且按照年齡分組

db.runCommand({"group":{"ns":"students","key":{"age":true},"initial":{"count":0},"condition":{"age":{"$gte":19}},"$reduce":function(doc,prev){

prev.count++;//表示數量加一

}

}});

以上的操作代碼就屬於一種MapReduce

四、MapReduce

MapReduce是整個大數據的精髓所在（實際中別用），所謂的MapReduce就是分位兩步處理數據：

Map：將數據分別取出；

Reduce：負責數據的最後的處理；

可是要想在MongoDB裏實現MapReduce處理，那麼複雜度是相當高的。

範例：建立一組僱員數據

db.emps.insert({"name":"張三","age":30,"sex":"男","job":"CLERK","salary":1000});

db.emps.insert({"name":"李四","age":28,"sex":"女","job":"CLERK","salary":5000});

db.emps.insert({"name":"王五","age":26,"sex":"男","job":"MANAGER","salary":6000});

db.emps.insert({"name":"趙六","age":32,"sex":"女","job":"MANAGER","salary":7000});

db.emps.insert({"name":"孫七","age":31,"sex":"男","job":"CLERK","salary":2000});

db.emps.insert({"name":"王八","age":35,"sex":"女","job":"PRESIDENT","salary":9000});

使用MapReduce操作最終會將處理結果保存在一個單獨的集合裏面，而最終處理效果如下

範例：按照職位分組，取得每個職位的人名

第一步：編寫分組的定義

var jobMapFun=function(){

emit(this.job,this.name);//按照job分組，取出name

};

//結果是：{key:"CLERK",values:[姓名,姓名,...]}

//第二步：編寫reduce操作

var jobReduceFun=function(key,values){

return {"job":key,"names":values};

};

//第三步：針對於MapReduce處理完成的數據實際上也可以執行一個最後處理。

var jobFinalizeFun=function(key,values){

if(key=="PRESIDENT"){

return{"job":key,"names":values,"info":"公司的老大"};

}

return{"job":key,"names":values};

}

//第四步：進行操作的整合

db.runCommand({

"mapreduce":"emps",

"map":jobMapFun,

"reduce":jobReduceFun,

"out":"t_job_emp",

"finalize":jobFinalizeFun

});

現在執行上面三步之後，所有的處理結果都保存在了t_job_emp集合中了。

db.t_job.emp.find().pretty();

範例：統計出各性別的人數、平均工資、最低工資、僱員姓名

var sexMapFun=function(){

//定義好了分組的條件，以及每個集合要取出的內容

emit(this.sex,{"ccount":1,"csal":this.salary,"cmax":this.salary,"cmin":this.salary,"cname":this.name});

};

var sexReduceFun=function(key,values){

var total=0;//統計

var sum=0;//計算總工資

var max=values[0].cmax;//假設第一個數據是最高工資

var min=values[0].cmin;//假設第一個數據是最低工資

var names=new Array();//定義數組內容

for(var x in values){//表示循環取出裏面的數據

total+=values[x].ccount;//人數增加

sum+=values[x].csal;//循環取出所有的工資，並且累加

if(max<values[x].cmax){//不是最高工資

max=values[x].cmax;

}

if(min<values[x].cmin){//不是最低工資

min=values[x].cmin;

}

names[x]=values[x].cname;//保存姓名

}

var avg=(sum/total).toFixed(2);//設置2位小數

//返回數據的處理結果

return {"count":total,"avg":avg,"sum" :sum,"max":max,"min":min,"names":names};

};

db.runCommand({

"mapreduce":"emps",

"map":sexMapFun,

"reduce":sexReduceFun,

"out": "t_sex_emp"});

結果如下：

雖然提供有最強悍的MapReduce支持，但是從現實的開發來將，真的不可能使用起來。

五、聚合框架（核心）

Mapreduce功能強大，但是它的複雜度和功能一樣強大，那麼很多時候我們需要MapReduce的功能，可是又不想把代碼寫的太複雜，所以從Mongo2.下版本之後開始引入了聚合框架並且提供了聚合函數：aggregate()

1,&group

group主要進行分組操作

範例：實現聚合查詢的功能--求出每個職位的僱員人數

db .emps.aggregate([{"$group":{"_id":"$job","job_count":{"$sum":1}}}]);

這樣的操作更加符合傳統的group by子句的操作使用。

範例：求出每個職位的總工資

db .emps.aggregate([{"$group":{"_id":"$job","job_sal":{"$sum":"$salary"}}}]);

在整個聚合框架裏面如果要引用每行的數據使用"$字段名稱"。

範例：計算出每個職位的平均工資

db .emps.aggregate([{"$group":{

"_id":"$job",

"job_sal":{"$sum":"$salary"},

"job_avg":{"$avg":"$salary"}

}}]);

範例：求出最高與最低工資

db .emps.aggregate([{"$group":{"_id":"$job","max_sal":{"$max":"$salary"},"min_sal":{"$min":"$salary"}}}]);