聚合管道是MongoDB中用于处理数据并返回计算结果的一系列阶段组合,通过aggregate()方法执行。它支持$match筛选、$group分组、$sort排序、$project字段控制等阶段,可实现复杂的数据处理操作。与find()相比,聚合能进行数据变换、分组统计、多集合关联和灵活输出控制。常见场景包括统计订单数量、按用户分组求和、多阶段组合查询前几名用户及投影新字段。阶段顺序至关重要,错误的顺序可能影响性能或结果准确性。

在 MongoDB 中,聚合操作用于处理数据并返回计算结果。当你需要在查询时进行过滤、分组、排序或统计等操作,就可以使用聚合管道(Aggregation Pipeline)。它比简单的 find() 更强大,能实现复杂的数据处理。
什么是聚合管道?
聚合管道是一系列数据处理阶段的组合,每个阶段将输入文档转换后传递给下一个阶段。常见的阶段包括:$match(筛选)、$group(分组)、$sort(排序)、$project(字段控制)等。
基本语法结构
使用 aggregate() 方法执行聚合查询:
{ $stage1: { ... } },
{ $stage2: { ... } },
...
])
常见使用场景示例
1. 查询并统计满足条件的文档数量
比如统计某个状态的订单数量:
db.orders.aggregate([{ $match: { status: "completed" } },
{ $group: { _id: null, total: { $sum: 1 } } }
])
这里先用 $match 筛选出已完成订单,再用 $group 统计总数。
2. 按字段分组并计算总和
按用户分组,计算每个用户的消费总额:
db.orders.aggregate([{ $group: {
_id: "$userId",
totalAmount: { $sum: "$amount" }
}}
])
注意 "$userId" 和 "$amount" 中的美元符号表示引用字段值。
3. 多阶段组合:筛选 + 分组 + 排序
找出完成订单中,消费最高的前 5 个用户:
db.orders.aggregate([{ $match: { status: "completed" } },
{ $group: {
_id: "$userId",
total: { $sum: "$amount" }
}},
{ $sort: { total: -1 } },
{ $limit: 5 }
])
4. 投影字段(类似 SELECT)
使用 $project 控制输出字段:
{ $project: {
name: 1,
email: 1,
fullName: { $concat: ["$firstName", " ", "$lastName"] }
}}
])
可以保留字段、重命名、或通过表达式生成新字段。
与普通查询的区别
普通 find() 只能做简单筛选和排序,而聚合可以:
- 对数据进行变换和计算
- 按条件分组统计
- 多集合关联(使用
$lookup) - 灵活控制输出结构
基本上就这些。聚合是 MongoDB 处理复杂查询的核心工具,掌握常用阶段就能应对大多数数据分析需求。不复杂但容易忽略的是阶段顺序——写错位置可能导致性能下降或结果错误。










