联合体(union)允许不同数据类型共享同一内存区域,其大小由最大成员决定,适用于节省内存、类型双关和硬件寄存器映射;但成员间会相互覆盖,不记录激活状态,需手动管理,C++11起推荐使用更安全的std::variant替代。

联合体(union)在C++中是一种特殊的数据类型,允许你在同一块内存位置存储不同的数据类型。但任何时候只能有一个成员有效。理解它的内存布局和使用方式,对底层编程、内存优化和类型转换很有帮助。
内存布局:共享同一段内存
union的所有成员共享同一块内存区域,这块内存的大小等于所有成员中占用空间最大的那个成员的大小。
例如:
union Data {
int i;
float f;
char str[8];
};
这个 union 的大小是 8 字节(由 str[8] 决定),int 和 float 都只占 4 字节,但整个 union 仍按最大成员对齐。
立即学习“C++免费学习笔记(深入)”;
当你写入一个成员时,会覆盖之前写入的其他成员的数据。比如:
Data d; d.i = 10; d.f = 3.14f; // 此时 d.i 的值已不可靠
因为 i 和 f 共享内存,修改 f 后,i 的二进制表示已被破坏。
典型用途与使用技巧
union 常用于以下场景:
- 节省内存:当多个变量不会同时使用时,用 union 可减少内存占用。
- 类型双关(type punning):通过不同成员访问同一数据的二进制表示,如查看 float 的位模式。
- 硬件寄存器映射:嵌入式开发中常用来解析寄存器的不同位段。
示例:查看 float 的整型位表示
union FloatInt {
float f;
int i;
};
FloatInt fi;
fi.f = 3.14f;
// 直接读取其二进制对应的整数形式
printf("Bits as int: %08X\n", fi.i);
注意:这种操作依赖于平台字节序和浮点格式(通常是 IEEE 754),可移植性较差。
限制与注意事项
union 有以下几个关键限制:
- 不能包含有构造函数或析构函数的类类型:比如 string、vector 等无法作为 union 成员(C++11 起支持带构造函数的类,但需手动管理生命周期)。
- 不记录当前激活的是哪个成员:程序员必须自己知道当前哪个成员有效,否则容易出错。
- 匿名 union:可以在作用域内定义匿名 union,直接访问成员:
union {
int a;
float b;
};
a = 100;
b = 2.5f; // 覆盖 a
匿名 union 必须定义在全局或命名空间作用域,且通常用于特殊场景如 Windows API 中。
C++11 起的改进:std::variant(推荐替代方案)
现代 C++ 推荐使用 std::variant 来替代传统 union,因为它更安全:
#include#include std::variant
v; v = 42; // 存 int v = 3.14f; // 存 float // 访问前检查类型 if (auto p = std::get_if (&v)) { std::cout << p << '\n'; }
std::variant 是类型安全的“联合体”,自带类型标签,避免了误读成员的问题。
基本上就这些。union 在需要精细控制内存时很有用,但要小心使用。理解它如何共享内存,能帮你避免数据被意外覆盖。现代代码中优先考虑 std::variant,传统 union 更适合系统级或兼容旧代码的场景。










