vector的size表示实际元素个数,capacity为不重新分配内存时的最大容量,扩容时按倍数申请新内存并迁移数据,频繁扩容影响性能,可使用reserve预分配内存以优化。

在C++中,vector 是最常用的动态数组容器之一。它能够自动管理内存,在元素数量增加时自动扩容。理解其扩容机制以及 capacity 与 size 的区别,对写出高效、稳定的代码至关重要。
size 与 capacity 的基本区别
size() 表示当前 vector 中实际存储的元素个数;而 capacity() 表示 vector 在不重新分配内存的前提下最多能容纳的元素数量。
举个例子:
vectorv.push_back(1);
v.push_back(2);
// 此时 size() == 2, capacity() 可能为 2、4 或更大(依赖实现)
只有当插入新元素导致 size > capacity 时,vector 才会触发扩容,重新分配更大的内存空间,并将原有数据复制过去。
立即学习“C++免费学习笔记(深入)”;
vector 扩容机制原理
vector 使用连续内存存储元素。当容量不足时,会执行以下步骤:
- 申请一块更大的内存空间(通常为原容量的某个倍数)
- 将原有元素逐个拷贝或移动到新内存
- 释放旧内存
- 更新内部指针指向新内存区域
关键点在于:扩容是“昂贵操作”,涉及内存分配和数据迁移。因此应尽量减少频繁扩容。
大多数 STL 实现采用“成倍增长”策略,常见的是 1.5 倍或 2 倍扩容。例如:
- 起始 capacity = 1
- 插入第2个元素 → 扩容至 2
- 插入第3个元素 → 扩容至 4
- 插入第5个元素 → 扩容至 8
这种策略保证了均摊时间复杂度为 O(1) 的插入效率。
如何优化扩容带来的性能损耗
可以通过预分配内存避免反复扩容:
- reserve(n):提前设置 capacity 至少为 n,不改变 size
- resize(n):改变 size 为 n,必要时也会扩容
如果已知将要存储大量元素,建议一开始就调用 reserve:
vectordata.reserve(10000); // 避免中间多次扩容
for (int i = 0; i data.push_back(i);
}
这样可将原本可能发生的十几次内存重分配降为零次,显著提升性能。
迭代器失效问题
每次扩容都会导致内存地址变更,因此所有指向原 vector 元素的迭代器、指针、引用都将失效。
例如:
vectorint* p = &v[0];
v.push_back(4); // 可能触发扩容
// 此时 p 指向的内存可能已被释放,使用 p 将导致未定义行为
编程时需特别注意这一点,尤其是在循环中修改 vector 并持有指针的情况。
基本上就这些。掌握 size 和 capacity 的差异,理解扩容机制,合理使用 reserve,能有效避免性能瓶颈和潜在 bug。










