
Mongoose连接的生命周期与状态
在使用Mongoose与MongoDB进行交互时,理解连接的生命周期和不同状态至关重要。Mongoose的Connection对象有一个readyState属性,它表示当前连接的状态:
- 0: disconnected (断开连接)
- 1: connected (已连接)
- 2: connecting (正在连接)
- 3: disconnecting (正在断开连接)
- 99: uninitialized (未初始化)
在异步操作中,我们通常需要等待连接建立后再执行数据库操作。Mongoose提供了多种方式来处理连接就绪:
- Promise-based Connection: mongoose.connect()返回一个Promise,可以直接使用await等待连接成功。
- Event Listeners: mongoose.connection对象是一个EventEmitter,可以监听'connected'、'error'、'disconnected'等事件。
问题分析:脚本挂起的根本原因
在提供的代码示例中,脚本在尝试执行dropCollection或insertMany操作时挂起,其关键部分如下:
// Check the connection to the database
console.log("Connection state: ", connection.readyState); // 输出 Connection state: 1
// Wait for the connection to be established
connection.once('connected', async () => {
// ... 数据库操作 ...
await connection.dropCollection('mdprodcats');
// ...
});根据终端输出,Connection state: 1表明在执行到connection.once('connected', ...)这一行时,Mongoose与MongoDB的连接已经处于已连接状态。
connection.once('connected', callback)的含义是:当Mongoose连接首次成功建立时,执行callback函数,且只执行一次。
问题的症结在于:
如果connection.readyState已经是1(已连接),那么'connected'事件不会再次触发。这意味着,嵌套在connection.once('connected', ...)回调函数中的所有数据库操作(包括dropCollection和insertMany)将永远不会被执行。脚本会一直等待一个永远不会发生的事件,从而导致无限期挂起。
解决方案:移除不必要的事件监听器
由于在执行到数据库操作逻辑时,连接已经确认处于connected状态(readyState为1),因此没有必要再使用connection.once('connected', ...)来等待连接。直接执行数据库操作即可。
修正后的代码结构:
const axios = require("axios");
const XLSX = require("xlsx");
const fs = require("fs");
const path = require("path");
const mongoose = require("mongoose");
// 假设 '../../../config/connection' 导出了 Mongoose Connection 实例
const connection = require("../../../config/connection");
const MdProdCat = require("../../../models/MdProdCat");
(async () => {
try {
console.log("=== Commencing MD Product Category import...");
// 文件下载、保存、转换等操作 (与数据库无关,保持不变)
console.log("Downloading .xlsx file...");
const response = await axios.get(
"https://assets.mydeal.com.au/content/marketplace/MyDeal_Product_Category_List.xlsx",
{ responseType: "arraybuffer" }
);
const xlsxFilePath = path.join(__dirname, "MyDeal_Product_Category_List.xlsx");
fs.writeFileSync(xlsxFilePath, Buffer.from(response.data));
console.log("Saved .xlsx file");
console.log("Converting .xlsx to .csv...");
const workbook = XLSX.read(response.data, { type: "buffer" });
const sheetNameList = workbook.SheetNames;
const csvData = XLSX.utils.sheet_to_csv(workbook.Sheets[sheetNameList[0]]);
console.log("Converted .xlsx to .csv");
console.log("Converting .csv to JSON...");
const rows = csvData.split("\n").slice(1);
const json = rows
.filter((line) => line.trim())
.map((line) => {
const [CategoryID, Breadcrumbs] = line.split(",");
return { _id: parseInt(CategoryID), Breadcrumbs };
});
console.log("Converted .csv to JSON");
// 检查连接状态 (可选,但有助于调试)
console.log("Connection state: ", connection.readyState);
// 直接执行数据库操作,因为连接已经就绪
try {
console.log("Dropping collection if it already exists");
// 注意:connection.db.dropCollection() 是更推荐的方式
// connection.dropCollection() 是 Mongoose 5.x 引入的便捷方法,底层也是调用 db 实例
await connection.db.dropCollection('mdprodcats');
console.log("Collection dropped successfully");
} catch (error) {
// 'ns not found' 是 MongoDB 在集合不存在时抛出的错误码
if (error.codeName === 'NamespaceNotFound' || error.message === 'ns not found') {
console.log('Collection does not exist. Continuing...');
} else {
throw error;
}
}
console.log("Inserting data...");
await MdProdCat.insertMany(json);
console.log("Data inserted successfully");
console.log("Closing connection...");
await connection.close();
console.log("Connection closed");
console.log("=== Import completed successfully");
process.exit(0); // 正常退出
} catch (error) {
console.error("An error occurred:", error);
process.exit(1); // 异常退出
}
})();关于connection.db.dropCollection()与connection.dropCollection()的补充:
- connection.db是Mongoose Connection实例的底层原生MongoDB Db实例。直接通过connection.db.dropCollection('collectionName')调用是更通用和明确的方式。
- connection.dropCollection('collectionName')是Mongoose在某些版本(如5.x及以上)提供的便捷方法,它内部通常也会通过connection.db来执行操作。两者在功能上通常等价,但使用connection.db更接近原生驱动API。
最佳实践与注意事项
-
明确连接管理:
-
对于独立的脚本,确保Mongoose连接在执行任何数据库操作之前完全建立。最健壮的方法是使用mongoose.connect()返回的Promise:
const mongoose = require('mongoose'); // ... 其他模块引入 async function runScript() { try { // 确保连接在所有操作之前建立 await mongoose.connect('mongodb://localhost:27017/yourdb', { useNewUrlParser: true, useUnifiedTopology: true, }); console.log('MongoDB connected successfully.'); // ... 在这里执行所有数据库操作 ... } catch (error) { console.error('Database connection or operation failed:', error); } finally { // 确保脚本结束时关闭连接 await mongoose.disconnect(); console.log('MongoDB disconnected.'); process.exit(error ? 1 : 0); } } runScript(); 如果连接是在应用程序启动时全局管理的(例如通过../../../config/connection),并且脚本是在连接已就绪的环境中运行,那么直接执行操作是合理的。
-
-
错误处理:
- 在dropCollection操作中,捕获并处理“集合不存在”的错误(ns not found或NamespaceNotFound)是良好的实践,可以避免脚本因尝试删除不存在的集合而中断。
- 始终使用try...catch块来包裹异步数据库操作,以捕获和处理潜在的运行时错误。
-
脚本退出:
- 在独立运行的Node.js脚本中,务必在所有异步操作完成后显式调用process.exit()来终止进程。否则,如果存在未关闭的数据库连接或其他资源,脚本可能会保持运行状态。
通过理解Mongoose连接的生命周期和正确使用其API,可以有效避免脚本挂起等常见问题,确保数据库操作的稳定性和可靠性。










