MongoDB管道操作符(二)

MongoDB 系列其他文章：

1.Linux上安装MongoDB
2.MongoDB基本操作
3.MongoDB数据类型
4.MongoDB文档更新操作
5.MongoDB文档查询操作(一)
6.MongoDB文档查询操作(二)
7.MongoDB文档查询操作(三)
8.MongoDB查看执行计划
9.初识MongoDB中的索引
10.MongoDB中各种类型的索引
11.MongoDB固定集合
12.MongoDB管道操作符(一)
13.MongoDB管道操作符(二)
14.MongoDB中MapReduce使用
15.MongoDB副本集搭建
16.MongoDB副本集配置
17.MongoDB副本集其他细节
18.初识MongoDB分片
19.Java操作MongoDB

上篇文章中我们已经学习了 MongoDB 中几个基本的管道操作符，本文我们再来看看其他的管道操作符。

$group

基本操作

$group 可以用来对文档进行分组，比如我想将订单按照城市进行分组，并统计出每个城市的订单数量：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",count:{$sum:1}}})

我们将要分组的字段传递给 $group 函数的 _id 字段，然后每当查到一个，就给 count 加 1，这样就可以统计出每个城市的订单数量。

算术操作符

通过算术操作符我们可以对分组后的文档进行求和或者求平均数。比如我想计算每个城市订单运费总和，如下：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",totalFreight:{ $sum:"$ freight"}}})

先按地址分组，再求和。这里贴出部分查询结果，如下：

{
    "_id" : "HaiKou",
    "totalFreight" : 20.0
}
{
    "_id" : "HangZhou",
    "totalFreight" : 10.0
}

也可以计算每个城市运费的平均数，如下：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",avgFreight:{ $avg:"$ freight"}}})

先按地址分组，然后再计算平均数。

极值操作符

极值操作符用来获取分组后数据集的边缘值，比如获取每个城市最贵的运费，如下：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",maxFreight:{ $max:"$ freight"}}})

查询每个城市最便宜的运费：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",minFreight:{ $min:"$ freight"}}})

按城市分组之后，获取该城市第一个运费单：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",firstFreight:{ $first:"$ freight"}}})

获取分组后的最后一个运费单：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",lastFreight:{ $last:"$ freight"}}})

数据操作符

$addToSet 可以将分组后的某一个字段放到一个数组中，但是重复的元素将只出现一次，而且元素加入到数组中的顺序是无规律的，比如将分组后的每个城市的运费放到一个数组中，如下：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",freights:{ $addToSet:"$ freight"}}})

重复的 freight 将不会被添加进来。

$push 则对重复的数据不做限制，都可以添加进来，如下：

db.sang_collect.aggregate({ $group:{_id:"$ orderAddressL",freights:{ $push:"$ freight"}}})

$unwind

$unwind 用来实现对文档的拆分,可以将文档中的值拆分为单独的文档，比如我的数据如下：

{
    "_id" : ObjectId("59f93c8b8523cfae4cf4ba86"),
    "name" : "鲁迅",
    "books" : [ 
        {
            "name" : "呐喊",
            "publisher" : "花城出版社"
        }, 
        {
            "name" : "彷徨",
            "publisher" : "南海出版出"
        }
    ]
}

使用 $unwind 命令将其拆分为独立文档，如下：

db.sang_books.aggregate({ $unwind:"$ books"})

拆分结果如下：

{
    "_id" : ObjectId("59f93c8b8523cfae4cf4ba86"),
    "name" : "鲁迅",
    "books" : {
        "name" : "呐喊",
        "publisher" : "花城出版社"
    }
}
{
    "_id" : ObjectId("59f93c8b8523cfae4cf4ba86"),
    "name" : "鲁迅",
    "books" : {
        "name" : "彷徨",
        "publisher" : "南海出版出"
    }
}

其他操作符

$sort 操作可以对文档进行排序，如下：

db.sang_collect.aggregate({$sort:{orderAddressL:1}})

用法和我们之前介绍普通搜索中的一致，可以按照存在的字段排序，也可以按照重命名的字段排序，如下：

db.sang_collect.aggregate({ $project:{oa:"$ orderAddressL"}},{$sort:{oa:-1}})

1 表示升序、-1 表示降序。

$limit 返回结果中的前 n 个文档，如下表示返回结果中的前三个文档：

db.sang_collect.aggregate({ $project:{oa:"$ orderAddressL"}},{$limit:3})

$skip 表示跳过前 n 个文档，比如跳过前 5 个文档，如下：

db.sang_collect.aggregate({ $project:{oa:"$ orderAddressL"}},{$skip:5})

$skip 的效率低，要慎用。

总结

在管道开始执行的阶段尽可能过滤掉足够多的数据，这样做有两个好处：

只有从集合中直接查询时才会使用索引，尽早执行过滤可以让索引发挥作用；
该过滤的数据过滤掉之后，也可以降低后面管道的执行压力。另外，MongoDB 不允许一个聚合操作占用过多的内存，如果有一个聚合操作占用了超过 20% 的内存，则会直接报错。

好了，MongoDB 中的管道操作符我们就先说到这里，小伙伴们有问题欢迎留言讨论。

参考资料：

《MongoDB权威指南第2版》

MongoDB管道操作符(二)

$group

基本操作

算术操作符

极值操作符

数据操作符

$unwind

其他操作符

总结

javaboy

相关推荐

各种干货

加技术群

热门标签

专注 Java 一百年

添加微信：a_java_boy
复制微信号

$group

基本操作

算术操作符

极值操作符

数据操作符

$unwind

其他操作符

总结

javaboy

相关推荐

各种干货

加技术群

热门标签

专注 Java 一百年

添加微信：a_java_boy复制微信号

添加微信：a_java_boy
复制微信号