目录
位域
有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。例如开关只有通电和断电两种状态,用 0 和 1 表示足以,也就是用一个二进位。正是基于这种考虑,C语言又提供了一种叫做位域的数据结构。
在结构体定义时,我们可以指定某个成员变量所占用的二进制位数(Bit),这就是位域。
定义结构体代码如下:
struct Test{
unsigned m;
unsigned n:4;
unsigned char ch:6;
};
:
后面的数字用来限定成员变量占用的位数。成员 m 没有限制,根据数据类型即可推算出它占用 4 个字节(Byte)的内存。成员 n、ch 被:
后面的数字限制,不能再根据数据类型计算长度,它们分别占用 4、6 位(Bit)的内存。
测试代码如下
struct Test t = {0x12345678,0x12345678,0x61};
printf("%zd\n",sizeof(struct Test));
printf("t.m=%x\n t.n=%x\n t.ch=%x\n",t.m,t.n,t.ch);
打印日志如下
8
t.m=12345678
t.n=8
t.ch=21
从上面可以看出结构体变量t占用8字节内存,而不是按内存对齐的要求12字节。下面我们通过lldb调试看下其内存结构
断点调试如下:
(lldb) p &t
(Test *) $0 = 0x00007ffeefbff5c8
(lldb) memory read/1gx 0x00007ffeefbff5c8
0x7ffeefbff5c8: 0x0000210812345678
(lldb)
内存分布如下:
成员变量m因为没有位域限制,占用4个字节,所以打印结果为0x12345678。
成员变量n因为有位域4,占用4个Bit位,0x12345678会发生溢出,只保留前4个bit位所以打印结果为0x8。
成员变量ch因为有位域6,占用6个Bit位,0x61会发生溢出,只保留前6个bit位为100001所以打印结果为0x21。
1、C语言标准规定,位域的宽度不能超过它所依附的数据类型的长度。通俗地讲,成员变量都是有类型的,这个类型限制了成员变量的最大长度,:后面的数字不能超过这个长度。
2、C语言标准还规定,只有有限的几种数据类型可以用于位域。在 ANSI C 中,这几种数据类型是 int、signed int 和 unsigned int(int 默认就是 signed int);到了 C99,_Bool 也被支持了
3、但编译器在具体实现时都进行了扩展,额外支持了 char、signed char、unsigned char 以及 enum 类型,所以上面的代码虽然不符合C语言标准,但它依然能够被编译器支持。
位域的存储
C语言标准并没有规定位域的具体存储方式,不同的编译器有不同的实现,但它们都尽量压缩存储空间。
1、当相邻成员的类型相同时,如果它们的位宽之和小于类型的 sizeof 大小,那么后面的成员紧邻前一个成员存储,直到不能容纳为止;如果它们的位宽之和大于类型的 sizeof 大小,那么后面的成员将从新的存储单元开始,其偏移量为类型大小的整数倍。
struct Test{
unsigned m:4;
unsigned n:4;
unsigned p:4;
};
struct Test t = {0x123456789abcdefa,0x123456789abcdefa,0x123456789abcdefa};
printf("%zd\n",sizeof(struct Test));
printf("t.m=%x\nt.n=%x\nt.ch=%x\n",t.m,t.n,t.p);
打印及lldb调试结果为
4
t.m=a
t.n=a
t.ch=a
(lldb) p &t
(Test *) $0 = 0x00007ffeefbff5c8
(lldb) memory read/1gx 0x00007ffeefbff5c8
0x7ffeefbff5c8: 0x0000000000000aaa
(lldb)
对结构体进行调整
struct Test{
unsigned m:4;
unsigned n:30;
unsigned p:4;
};
struct Test t = {0x123456789abcdefa,0x123456789abcdefa,0x123456789abcdefa};
printf("%zd\n",sizeof(struct Test));
printf("t.m=%x\nt.n=%x\nt.ch=%x\n",t.m,t.n,t.p);
打印及lldb调试结果为
12
t.m=a
t.n=1abcdefa
t.ch=a
(lldb) p &t
(Test *) $0 = 0x00007ffeefbff5c0
(lldb) memory read/2gx 0x00007ffeefbff5c0
0x7ffeefbff5c0: 0x1abcdefa0000000a 0x000000000000000a
2、当相邻成员的类型不同时,不同的编译器有不同的实现方案,GCC 会压缩存储,而 VC/VS 不会。
struct Test{
unsigned m:4;
unsigned char n:4;
unsigned p:4;
};
struct Test t = {0x123456789abcdefa,0x123456789abcdefa,0x123456789abcdefa};
printf("%zd\n",sizeof(struct Test));
printf("t.m=%x\nt.n=%x\nt.ch=%x\n",t.m,t.n,t.p);
打印及lldb调试结果为
4
t.m=a
t.n=a
t.ch=a
(lldb) p &t
(Test *) $0 = 0x00007ffeefbff5c8
(lldb) memory read/1wx 0x00007ffeefbff5c8
0x7ffeefbff5c8: 0x00000aaa
在 GCC 下的运行结果为 4,三个成员挨着存储;在 VC/VS 下的运行结果为 12,三个成员按照各自的类型存储(与不指定位宽时的存储方式相同)。
3、如果成员之间穿插着非位域成员,那么不会进行压缩。
struct Test{
unsigned m:4;
unsigned n;
unsigned p:4;
};
struct Test t = {0x123456789abcdefa,0x123456789abcdefa,0x123456789abcdefa};
printf("%zd\n",sizeof(struct Test));
printf("t.m=%x\nt.n=%x\nt.ch=%x\n",t.m,t.n,t.p);
打印及lldb调试结果为
12
t.m=a
t.n=9abcdefa
t.ch=a
(lldb) p &t
(Test *) $0 = 0x00007ffeefbff5c0
(lldb) memory read/2gx 0x00007ffeefbff5c0
0x7ffeefbff5c0: 0x9abcdefa0000000a 0x000000000000000a
无名位域
位域成员可以没有名称,只给出数据类型和位宽,如下所示:
struct bs{
int m: 12;
int : 20; //该位域成员不能使用
int n: 4;
};
无名位域一般用来作填充或者调整成员位置。因为没有名称,无名位域不能使用。
上面的例子中,如果没有位宽为 20 的无名成员,m、n 将会挨着存储,sizeof(struct bs) 的结果为 4;有了这 20 位作为填充,m、n 将分开存储,sizeof(struct bs) 的结果为 8。
行者常至,为者常成!