联合体大小由其最大成员决定,因其所有成员共享同一内存区域,必须足够容纳最大成员并满足最严格对齐要求。结构体成员独立存储,大小为各成员之和加填充;联合体成员共享起始地址,任一时刻仅一个成员有效,大小至少为最大成员大小且为最严格对齐要求的倍数。典型应用包括节省内存(如消息负载)、实现变体类型(配合枚举)以及底层类型转换(现代C++推荐std::bit_cast替代)。

C++联合体(union)的大小确实是由其所有成员中占用内存空间最大的那个成员决定的。这不是一个巧合,而是其设计哲学——节省内存——的必然结果。所有成员都共享同一块内存区域,因此这块区域必须足够大以容纳其中最大的“住客”。
联合体的本质在于其内存共享机制。与结构体(struct)不同,结构体的成员是依次排列的,每个成员都有自己独立的内存空间,所以结构体的大小是所有成员大小之和(加上可能的填充字节)。而联合体的所有成员都从同一个内存地址开始存储。这意味着在任何给定时间,联合体只能存储其中一个成员的值。为了确保任何成员都能被完整地存储进去,编译器自然会分配一块足够大的内存区域,其大小至少要等于它所有成员中最大的那个。如果最大的成员是
double
char
int
double
union MyUnion {
char c; // 1 byte
int i; // 4 bytes
double d; // 8 bytes
};
// 在大多数系统上,sizeof(MyUnion) 会是 8(或更多,由于对齐,但至少是8)。这里其实隐含了一个重要的点,就是内存对齐。联合体的大小不仅要能容纳最大的成员,还要满足所有成员的对齐要求,特别是最大成员的对齐要求。
结构体(struct)和联合体(union)在C++中都是复合数据类型,但它们在内存布局和使用方式上有着天壤之别。
立即学习“C++免费学习笔记(深入)”;
结构体 (struct): 它的成员是各自独立、顺序存储的。这意味着每个成员都拥有自己独立的内存地址,即使因为内存对齐规则,成员之间可能存在一些填充(padding)字节,它们也绝不会重叠。
sizeof(struct)
联合体 (union): 它的成员共享同一块内存区域,从同一个起始地址开始存储。这意味着在任何给定时刻,你只能有效地使用其中一个成员。当你给一个成员赋值后,这块共享内存区域的内容就会被这个新值覆盖,其他成员的值可能变得不可预测或无意义(如果它们类型不同)。
sizeof(union)
即使联合体最大的成员是X字节,但实际的
sizeof(union)
int
double
联合体作为一个整体,其起始地址必须满足其所有成员中对齐要求最严格的那个。同时,联合体的总大小也必须是其最严格对齐要求的倍数,以确保在数组中,下一个联合体实例也能正确对齐。
示例:
union AlignedUnion {
char a; // 1 byte, 默认对齐1字节
int b; // 4 bytes, 默认对齐4字节
double c; // 8 bytes, 默认对齐8字节
};
// 在大多数64位系统上,sizeof(AlignedUnion) 会是 8。
// 因为最大的成员是double (8字节),它的对齐要求是8字节。
// 所以整个union的大小必须是8的倍数,且至少能容纳8字节。
union AnotherUnion {
char c; // 1 byte, 默认对齐1字节
long long ll; // 8 bytes, 默认对齐8字节
short s; // 2 bytes, 默认对齐2字节
};
// sizeof(AnotherUnion) 也会是 8。
// 最大的成员是long long (8字节),对齐要求是8。
// 即使char和short都在,union大小也必须是8的倍数。这种对齐规则有时会让人觉得有点“浪费”,比如一个
char
long long
long long
联合体虽然在现代C++中被一些更安全的替代方案(如
std::variant
节省内存: 这是联合体最直接、最核心的应用。当你知道在程序的不同阶段,同一块内存区域需要存储不同类型但不会同时使用的信息时,联合体是理想选择。例如,在一个消息处理系统中,一个消息结构可能包含不同类型的负载(文本、图片数据、控制指令),但每次只发送一种。使用联合体可以避免为每种可能的负载类型都分配独立的内存,从而显著减少内存占用。
变体类型 (Variant Types): 联合体常与枚举(enum)结合使用,创建“变体”类型,即一个数据结构可以表示多种不同的数据类型。枚举用于指示当前联合体中哪个成员是活跃的,从而安全地访问正确的成员。
enum DataType {
INT_TYPE,
DOUBLE_TYPE,
STRING_TYPE // 假设是固定大小的字符串
};
struct Data {
DataType type; // 用于指示当前活跃的类型
union {
int iVal;
double dVal;
char sVal[20]; // 固定大小字符串,避免动态内存分配的复杂性
} value;
};
// 使用示例:
Data myData;
myData.type = INT_TYPE;
myData.value.iVal = 123;
// 或者
myData.type = DOUBLE_TYPE;
myData.value.dVal = 3.14;
// 访问时需要检查类型:
if (myData.type == INT_TYPE) {
// 使用 myData.value.iVal
}这种模式在实现类似
std::variant
底层数据操作/类型转换(通常不推荐,但仍存在于遗留代码): 联合体有时被用来“欺骗”编译器,将一块内存区域按不同的类型解释,从而实现某些底层操作。例如,将
float
unsigned int
union FloatToInt {
float f;
unsigned int i;
};
FloatToInt converter;
converter.f = 3.14f;
// 现在 converter.i 包含了 3.14f 的原始位模式
// 注意:这种做法在C++中严格来说是类型双关 (type punning),
// 除了C++20引入的union成员访问规则外,通常会导致未定义行为 (UB)。
// 推荐的现代C++做法是使用 memcpy 或 C++20的 std::bit_cast 来进行这种位模式转换,
// 以确保行为是明确和可移植的。我个人在维护一些老代码时,确实见过这种用法,虽然现在看来有些“野蛮”,但在那个年代,它提供了一种绕过类型系统的直接访问方式。不过,现代C++已经提供了更安全、更明确的机制来处理这些需求,因此在新的代码中应尽量避免这种直接的联合体类型双关。
以上就是C++中联合体的大小是如何由其最大的成员决定的的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号