C语言位运算符

对于更多紧凑的数据,C 程序可以用独立的位或多个组合在一起的位来存储信息。文件访问许可就是一个常见的应用案例。位运算符允许对一个字节或更大的数据单位中独立的位做处理:可以清除、设定,或者倒置任何位或多个位。也可以将一个整数的位模式(bit pattern)向右或向左移动。

整数类型的位模式由一队按位置从右到左编号的位组成,位置编号从 0 开始,这是最低有效位(least significant bit)。例如,考虑字符值'*',它的 ASCII 编码为 42,相当于二进制的 101010:
位模式 0 0 1 0 1 0 1 0
位位置 7 6 5 4 3 2 1 0

在本例中,值 101010 被表示成一个 8 位的字节内容,因此前面多两个 0。

布尔位运算符

表 1 中列举的运算符可以对操作数的每个位进行布尔运算。这种二元运算符把两个不同操作数内相同位置的位关联起来。被设定的位(也就是值为 1 的位)被解释为 true,被清除的位(也就是值为 0 的位)被解释为 false。

除布尔运算符 AND、OR 和 NOT 以外,也有位异或运算符(exclusive-OR,XOR)。这些都在表 1 进行了列举。

表1 布尔位运算符
运算符 意义 示例 对于每个位位置的结果(1=设定,0=清除)
    &     位 AND  x&y  如果 x 和 y 都为 1,则得到 1;如果 x 或 y 任何一个为 0,或都为0,则得到 0
    |     位 OR  x|y  如果 x 或 y 为 1,或都为 1,则得到 1;如果 x 和 y 都为 0,则得到 0
    ^     位 XOR  x^y  如果 x 或 y 的值不同,则得到 1;如果两个值相同,则得到 0
    ~     位 NOT(I的补码)  ~x  如果 x 为 0,则得到 1,如果 x 是 1,则得到 0

位运算符的操作数必须是整数类型,并且遵循寻常算术转换(usualarithmetic conversion)。转换后获得的操作数通用类型就是整个计算结果的类型。表 2 展示了这些运算符的效果。

表2 位运算符的效果
表达式(或声明) 位模式
int a=6; 0···00110
int b=11; 0···01011
a&b 0···00010
a|b 0···01111
a^b 0···01101
~a 1···11001


可以将一个整数 a 的特定位清除,做法是将整数 a 和另一个整数进行位 AND 运算,其中,另一个整数在需要清除的位为 0,其他位则为 1,并位 AND 运算,其中,另一个整数在需要清除的位为 0,其他位则为 1,并将 AND 运算的结果赋值给整数 a。

该另一个整数,即位 AND 运算的第二个操作数,被设定为 1 的位置(称为位掩码),这些位置经过位 AND 运算,不会改变第一个操作数对应位置的值。例如,一个整数与一个位掩码 0xFF 进行位 AND 运算后,将保留最低位置的 8 个位,而会清除其他所有位的值:
a &= OxFF;            // 相当于:a = a & OxFF;

在该示例中,复合赋值运算符 &= 也会执行 & 运算。复合赋值运算符与其他二元位运算符具有类似的执行方式,这里不再赘述。

位运算符可以用来生成位掩码,以供以后的位运算使用。例如,在位模式 0x20 中,只有位5被设定。因此表达式 ~0x20 会生成一个只有位 5 没有被设定的位掩码:
a &= ~0x20;             // 清除a中的位5
位掩码 ~0x20 比 0xFFFFFFDF 更受欢迎,因为它的可移植性更好:结果不会受到机器字大小的影响(同时也更方便人阅读)。

也可以使用运算符 |(OR)和 ^(XOR)来设定或清除特定位,下面是一个示例:
int mask = OxC;
a |= mask;              // 设定a的位2和位3
a ^= mask;              // 求反a的位2和位3

第二个转换使用相同的位掩码,它会将第一次转换的结果再反转一次。换句话说,b^mask^mask 会得到原来 b 的值。这个操作可以用于交换两个整数的值,而不需要使用第三个临时变量:
a ^= b;                  // 等效于 a = a ^ b;
b ^= a;                 // 将a原来的值赋值给b
a ^= b;                 // 将b原来的值赋值给a

本例中的前两个表达式等同于 b=b^(a^b)或 b=(a^b)^b。其结果等同于 b=a,副作用是 a 的值也被修改了,其修改后的值为 a^b。在这时,第三个表达式具有如下副作用 a=(a^b)^a 或 a=b(使用 a 和 b 的原始值)。

移位运算符

移位运算符将左操作数的位模式移动数个位置,至于移动几个位置,由右操作数指定。它们如表 3 列举。


表3 移位运算符
运算符 意义 示例 结果
<< 向左移位 x<<y x 的每个位向左移动 y 个位
>> 向右移位 x>>y x 的每个位向右移动 y 个位


移位运算符的操作数必须是整数。在实际移位操作之前,两个操作数都要进行整数提升(promotion)。右边操作数不可以为负值,并且必须少于左边操作数在整数提升之后的位长。如果不符合这些条件,程序运行结果将无法确定。

移位运算结果的类型等于左操作数在整数提升后的类型。下面示例的移位表达式具有 unsigned long 类型。
unsigned long n = 0xB,     // 位模式: 0 ... 0 0 0 1 0 1 1
         result = 0;
result = n << 2;          //              0 ... 0 1 0 1 1 0 0
result = n >> 2;          //              0 ... 0 0 0 0 0 1 0

在向左移位运算时,右边多出来的位用 0 来填充。移动超出左边边界的位则直接抛弃。向左移动 y 个位置,就等同于将左操作数乘以 2^{y}:如果左操作数 x 是无符号类型,那么表达式 x<<y 的结果等于表达式 x×2^{y} 的值。因此,在前面的例子,n<<2 的值为 n×4,也就是 44。

在向右位移运算时,如果左操作数是无符号类型,或者左操作数是带符号类型但为非负值,则左边多出来的位用 0 来填充。在这种情况下,表达式 x>>y 的结果等效于表达式 x/2^{y} 的值。如果左操作数是负值,那么由编译器决定用于填充至左边多出来的位的内容,可能是 0,也可能是符号位。
// 函数setBit()
// 设定掩码m中p位置的位。
// 使用定义在limits.h中的CHAR_BIT,存储一个字节内的位的数目。
// 返回值: 完成位设定的新掩码,其中p位置已设定好
//              如果p不是有效的位置,则返回原始掩码。

unsigned int setBit( unsigned int mask, unsigned int p )
{
  if ( p >= CHAR_BIT * sizeof(int) )
    return mask;
  else
    return mask | (1<<p);
}

移位运算符的优先级比算术运算符的优先级更低,但相对于比较运算符以及其他的位操作运算符,具有更高的优先级。上例表达式 mask|(1<<p)中的括号必要性不大,主要是让程序代码更容易阅读。