小文件小于16MB时直接存储二进制数据到文档中,利用BinData类型保存并附带元信息;大文件超过16MB则使用GridFS,自动分块存储于fs.chunks和fs.files集合,支持断点续传与流式读取,适合视频等大文件,根据文件大小和访问需求选择方案。

在 MongoDB 中存储文件,通常有两种方式:使用 GridFS 和 直接存 Base64 编码或二进制数据到文档中。选择哪种方式取决于文件大小和使用场景。
小文件:直接存二进制数据(BSON Binary)
如果文件较小(一般建议小于 16MB),可以直接将文件内容以二进制形式存入文档字段中。
MongoDB 的单个文档大小限制是 16MB,所以这种方式只适合图片、小文档等轻量级文件。
- 使用
BinData类型保存二进制数据 - 可以配合文件名、类型、上传时间等元信息一起存储
- 读取时直接从文档取出二进制流即可
示例结构:
{
"_id": ObjectId("..."),
"filename": "avatar.png",
"contentType": "image/png",
"data": BinData(0, "base64encoded..."),
"uploadDate": ISODate("...")
}
大文件:使用 GridFS
对于超过 16MB 的文件,比如视频、大型文档等,MongoDB 提供了 GridFS 来处理。
GridFS 会自动把大文件拆分成多个小块(默认每个 chunk 是 255KB),分别存储在名为 fs.chunks 的集合中,同时用 fs.files 集合保存文件的元信息。
- 突破 16MB 文档大小限制
- 支持断点续传和部分读取(如只读视频前几秒)
- 可以通过文件名或自定义元数据查询
- 多数官方驱动都内置了 GridFS API,使用方便
常用操作:
用命令行或程序通过 mongofiles 工具上传:
mongofiles put large-video.mp4
程序中可用驱动提供的 GridFS 接口进行读写。
怎么选?
基本原则是:
- 文件
- 文件 ≥ 16MB 或需要分段访问 → 使用 GridFS
- 频繁更新整个文件 → 存二进制更合适
- 需要流式读取或节省内存 → GridFS 更优
基本上就这些。MongoDB 不像传统文件系统,但它通过灵活的设计能很好地支持文件存储需求。关键是根据文件大小和访问模式合理选择方式。










