散文網(wǎng) » 科技 »學(xué)習(xí) » C/C++編程筆記：C語言結(jié)構(gòu)體—位域，如何指定成員變量所占Bit？

C/C++編程筆記：C語言結(jié)構(gòu)體—位域，如何指定成員變量所占Bit？

2020-06-11 21:49 作者:C語言編程__Plus 0人讀過 | 我要投稿

有些數(shù)據(jù)在存儲時并不需要占用一個完整的字節(jié)，只需要占用一個或幾個二進(jìn)制位即可。比如開關(guān)只有通電和斷電兩種狀態(tài)，用 0 和 1 表示足以，也就是用一個二進(jìn)位。正是基于這種考慮，C語言又提供了一種叫做位域的數(shù)據(jù)結(jié)構(gòu)。

在結(jié)構(gòu)體定義時，我們可以指定某個成員變量所占用的二進(jìn)制位數(shù)（Bit），這就是位域。

structtest{

unsigned m;

unsigned n:4;

unsignedchar ch:6;

}

:后面的數(shù)字用來限定成員變量占用的位數(shù)。成員 m 沒有限制，根據(jù)數(shù)據(jù)類型即可推算出它占用 4 個字節(jié)（Byte）的內(nèi)存。成員 n、ch 被:后面的數(shù)字限制，不能再根據(jù)數(shù)據(jù)類型計(jì)算長度，它們分別占用 4、6 位（Bit）的內(nèi)存。

n、ch 的取值范圍非常有限，數(shù)據(jù)稍微大些就會發(fā)生溢出。

運(yùn)行結(jié)果：

0xad, 0xe, $??

0xb8901c, 0xd, :

對于 n 和 ch，第一次輸出的數(shù)據(jù)是完整的，第二次輸出的數(shù)據(jù)是殘缺的。

第一次輸出時，n、ch 的值分別是 0xE、0x24（'$' 對應(yīng)的 ASCII 碼為 0x24），換算成二進(jìn)制是 1110、10 0100，都沒有超出限定的位數(shù)，能夠正常輸出。

第二次輸出時，n、ch 的值變?yōu)?0x2d、0x7a（'z' 對應(yīng)的 ASCII 碼為 0x7a），換算成二進(jìn)制分別是 10 1101、111 1010，都超出了限定的位數(shù)。超出部分被直接截去，剩下 1101、11 1010，換算成十六進(jìn)制為 0xd、0x3a（0x3a 對應(yīng)的字符是 :）。

C語言標(biāo)準(zhǔn)規(guī)定，位域的寬度不能超過它所依附的數(shù)據(jù)類型的長度。通俗地講，成員變量都是有類型的，這個類型限制了成員變量的最大長度，:后面的數(shù)字不能超過這個長度。

例如上面的test，n 的類型是 unsigned int，長度為 4 個字節(jié)，共計(jì) 32 位，那么 n 后面的數(shù)字就不能超過 32；ch 的類型是 unsigned char，長度為 1 個字節(jié)，共計(jì) 8 位，那么 ch 后面的數(shù)字就不能超過 8。

我們可以這樣認(rèn)為，位域技術(shù)就是在成員變量所占用的內(nèi)存中選出一部分位寬來存儲數(shù)據(jù)。

C語言標(biāo)準(zhǔn)還規(guī)定，只有有限的幾種數(shù)據(jù)類型可以用于位域。在 ANSI C 中，這幾種數(shù)據(jù)類型是?int、signed int 和 unsigned int（int 默認(rèn)就是 signed int）；到了 C99，_Bool 也被支持了。

但編譯器在具體實(shí)現(xiàn)時都進(jìn)行了擴(kuò)展，額外支持了 char、signed char、unsigned char 以及 enum 類型，所以上面的代碼雖然不符合C語言標(biāo)準(zhǔn)，但它依然能夠被編譯器支持。

位域是如何存儲

C語言標(biāo)準(zhǔn)并沒有規(guī)定位域的具體存儲方式，不同的編譯器就有不同的方法來實(shí)現(xiàn)，但它們都盡量壓縮位域存儲空間。

位域的具體存儲規(guī)則如下：

1) 當(dāng)相鄰成員的類型相同時，如果它們的位寬之和小于類型的 sizeof 大小，那么后面的成員緊鄰前一個成員存儲，直到不能容納為止；如果它們的位寬之和大于類型的 sizeof 大小，那么后面的成員將從新的存儲單元開始，其偏移量為類型大小的整數(shù)倍。

以下面的位域 test?為例：

運(yùn)行結(jié)果：4

m、n、p 的類型都是 unsigned int，sizeof 的結(jié)果為 4 個字節(jié)（Byte），也即 32 個位（Bit）。m、n、p 的位寬之和為 6+12+4 = 22，小于 32，所以它們會挨著存儲，中間沒有縫隙。

如果將成員 m 的位寬改為 22，那么輸出結(jié)果將會是 8，因?yàn)?22+12 = 34，大于 32，n 會從新的位置開始存儲，相對 m 的偏移量是 sizeof(unsigned int)，也即 4 個字節(jié)。

如果再將成員 p 的位寬也改為 22，那么輸出結(jié)果將會是 12，三個成員都不會挨著存儲。

2) 當(dāng)相鄰成員的類型不同時，不同的編譯器有不同的實(shí)現(xiàn)方案，GCC 會壓縮存儲，而 VC/VS 不會。

請看下面的位域 test：

在 GCC 下的運(yùn)行結(jié)果為 4，三個成員挨著存儲；在 VC/VS 下的運(yùn)行結(jié)果為 12，三個成員按照各自的類型存儲（與不指定位寬時的存儲方式相同）。

3) 如果成員之間穿插著非位域成員，那么不會進(jìn)行壓縮。

eg:

structtest{

unsigned m:12;

unsigned ch;

unsigned p:4;

};

在各個編譯器下 sizeof 的結(jié)果都是 12。

通過上面的分析，我們發(fā)現(xiàn)位域成員往往不占用完整的字節(jié)，有時候也不處于字節(jié)的開頭位置，因此使用&獲取位域成員的地址是沒有意義的，C語言也禁止這樣做。地址是字節(jié)的編號，而不是位的編號。

無名位域

位域成員可以沒有名稱，只給出數(shù)據(jù)類型和位寬，如下所示：

structtest{

int m:12;

int:20;//該位域成員不能使用

int n:4;

};

無名位域一般用來作填充或者調(diào)整成員位置。因?yàn)闆]有名稱，無名位域不能使用。

上面的例子中，如果沒有位寬為 20 的無名成員，m、n 將會挨著存儲，sizeof(struct bs) 的結(jié)果為 4；有了這 20 位作為填充，m、n 將分開存儲，sizeof(struct bs) 的結(jié)果為 8。

學(xué)習(xí)C/C++編程知識，提升C/C++編程能力，歡迎關(guān)注UP一起來成長！
另外，UP在主頁上傳了一些學(xué)習(xí)C/C++編程的視頻教程，有興趣或者正在學(xué)習(xí)的小伙伴一定要去看一看哦！會對你有幫助的~

歡迎評論、點(diǎn)贊、收藏、投幣、轉(zhuǎn)發(fā)

標(biāo)簽：編程 C語言 C/C++結(jié)構(gòu)體知識分享編程筆記編程知識 C語言知識位域無名位域