一文读懂原码、反码与补码
一、二进制
二进制和十进制一样,也是一种进位计数制,但是它的基数是 2。二进制表达式中 0 和 1 的位置不同,它所代表的数值也不同。例如,二进制数 00001010
表示十进制数 10。一个二进制数具有两个基本特点:两个不同的数字符号,即 0 和 1,逢二进一。
十进制与二进制数之间的转换
用计算机处理十进制数时,必须先把它转化为二进制数才能被计算机所接受;同理,计算结果应该将二进制数转换成人们习惯的十进制数。
十进制转换成二进制
把一个十进制转换为二进制的方法是:把被转换的十进制数反复地除以 2,直到商为 0 为止,所得余数(从末位读起)就是这个数的二进制表示,简单地说,就是 "除 2 取余法"。
(图片来源 —— wikihow.com)
二进制转十进制
要把二进制转换为十进制数,只要将二进制数按权展开求和即可。
(图片来源 —— wikihow.com)
二、数值型数据的表示
在计算机内数值型数据分成整数和实数两大类。数据都是以二进制的形式存储和运算的。计算机中的数字电路只能直接识别二进制数据,数的正(+)、负(-)号是不能被计算机识别的,为了让计算机能识别正、负号,就必须对符号进行编码,或者说把符号数字化。通常采用二进制数的最高位来表示符号,用 ”0“ 表示正数,”1“ 表示负数。
整数的表示
整数可分为无符号整数和有符号整数。在无符号整数中,所有二进制位全部用来表示数的大小;在有符号整数中,用最高位表示数的正负号,其他位表示数的大小。如果用一个字节表示一个无符号整数,其取值范围是 0 ~255。如果表示一个有符号整数,其取值范围是 -128 ~ 127。计算机中的地址常用无符号整数表示,可以用 8 位、16 位或 64 位来表示。
实数的表示
实数一般用浮点数表示,因为它的小数点位置不固定,所以称为浮点数。它是既有整数又有小数的数,纯小数可以看做实数的特例,例如,76.625,0.00345 都是实数,又可以表示为:
76.625=10^2 ×(0.76625)
0.00345=10^-2 × (0.345)
其中,指数部分用来指出实数中小数点的位置,括号内的一个纯小数。在计算机中一个浮点数由指数(阶码)和尾数两部分组成,阶码部分由阶符和阶码组成,尾数部分由尾符和尾数组成。其机内表示形式如下:
阶码用来指示尾数中的小数点应当向左或向右移动的位数;尾数表示数值的有效数字,其小数点约定在数符和尾数之间,在浮点数中数符和阶符各占 1 位,阶码的值随浮点数数值的大小而定,尾数的位数则依浮点数数值的精度要求而定。
三、原码、反码和补码
为运算方便,机器数有 3 种表示法,即原码、反码和补码。
原码
原码是一种计算机中对数字的二进制定点表示法。原码表示法在数值前面增加了一位符号位(即最高位为符号位):正数该位为 0,负数该位为 1(0 有两种表示:+0 和 -0),其余位表示数值的大小。举个例子,我们用 8 位二进制表示一个数,+12 的原码为 00001100,-12 的原码就是 10001100。
反码
一个数字用原码表示是容易理解的,但是需要单独一个位来表示符号位,并且在进行加法时,计算机需要先识别某个二进制原码是正数还是负数,识别出来之后再进行相应的运算。这样效率不高,能不能让计算机在进行运算时不用去管符号位,也就是让符号位参与运算。要实现这个功能,我们就要用到反码。
反码是一种在计算机中数的机器码表示。对于单个数值(二进制的 0 和 1)而言,对其进行取反操作就是将 0 变为 1,1 变为 0。正数的反码和原码一样,负数的反码就是在原码的基础上符号位保持不变,其他位取反。
十进制 | 原码 | 反码 |
---|---|---|
6 | 0000 0110 | 0000 0110 |
-3 | 1000 0011 | 1111 1100 |
下面我们来看一下,用反码直接运算会是什么情况,我们以 6-3
为例, 6-3
等价于 6+(-3)
。
6 - 3 ==> 6 + (-3)
0000 0110 // 6(反码)
+ 1111 1100 // -3(反码)
----------------------
0000 0010 // (反码)
0000 0010 // 2(原码)
很明显通过反码进行 6+(-3)
加法运算时,输出值比预期值差了一个 1。接着我们再来看下 1+(-1)
的运算结果:
1 - 1 ==> 1 + (-1)
0000 0001 // 1(反码)
+ 1111 1110 // -1(反码)
----------------------
1111 1111 // (反码)
1000 0000 // -0(原码)
由上可知 1+(-1)
的运算结果为 -0
,而我们预期的值是 +0
。我们继续看个示例 0+0
:
0 + 0 ==> 0 + 0
0000 0000 // 0(反码)
+ 0000 0000 // 0(反码)
----------------------
0000 0000 // (反码)
0000 0000 // 0(原码)
这里我们可以知道 -0 对应的原码是 10000000
,而 +0 对应的原码是 00000000
。虽然 -0 和 +0 代表的数值是一样的,但是在用原码和反码表示时它们是不同的。通过以上的多个示例,我们发现使用反码进行加法运算并不能保证得出正确的结果。原因是用一个字节表示数字的取值范围时,这些数字中多了一个 -0。为了解决反码出现的问题,就出现了补码。
补码
补码是一种用二进制表示有符号数的方法。正数和 0 的补码就是该数字本身。负数的补码则是将其对应正数按位取反再加 1。补码系统的最大优点是可以在加法或减法处理中,不需因为数字的正负而使用不同的计算方式。只要一种加法电路就可以处理各种有符号数加法,而且减法可以用一个数加上另一个数的补码来表示,因此只要有加法电路和补码电路即可以完成各种有符号数加法和减法,在电路设计上相当方便。
另外,补码系统的 0 就只有一个表示方式,这和反码系统不同(在反码系统中,0 有两种表示方式),因此在判断数字是否为 0 时,只要比较一次即可。下图是一些 8 位补码系统的整数,它可表示的范围包括 -128 到 127,总共 256 个整数。
既然说补码可以解决反码在运算中遇到的问题,我们继续以 6+(-3)
为例来验证一下这个结论。
十进制 | 原码 | 反码 | 补码 |
---|---|---|---|
6 | 0000 0110 | 0000 0110 | 0000 0110 |
-3 | 1000 0011 | 1111 1100 | 1111 1101 |
6+(-3)
以补码形式的计算过程如下:
6 - 3 ==> 6 + (-3)
0000 0110 // 6(补码)
+ 1111 1101 // -3(补码)
----------------------
0000 0011 // 3(补码)
很明显这时我们得到了正确的结果,那么我们再来看一下以补码形式计算 1-1
的计算过程:
1 - 1 ==> 1 + (-1)
0000 0001 // 1(补码)
+ 1111 1111 // -1(补码)
----------------------
0000 0000 // 0(补码)
可以发现,补码完美解决了反码的问题,最后我们来介绍一下位移运算。
四、位移运算
位移运算需要使用按位移动操作符,它有两个操作数:第一个是要被移动的数字,而第二个是要移动的长度。移动的方向根据操作符的不同而不同。
按位移动会先将操作数转换为大端字节序顺序(big-endian order)的 32 位整数,并返回与左操作数相同类型的结果。右操作数应小于 32 位,否则只有最低 5 个字节会被使用。
左移(<<)
该操作符会将第一个操作数向左移动指定的位数。向左被移出的位被丢弃,右侧用 0 补充。以 9<<2
为例:
9 (base 10): 00000000000000000000000000001001 (base 2)
--------------------------------
9 << 2 (base 10): 00000000000000000000000000100100 (base 2) = 36 (base 10)
在数字 x 上左移 y 位时,得出的结果是 x * 2^y,即 9<<2=9*2^2
。
有符号右移(>>)
该操作符会将第一个操作数向右移动指定的位数。向右被移出的位被丢弃,拷贝最左侧的位以填充左侧。由于新的最左侧的位总是和以前相同,符号位没有被改变。所以被称作 “符号传播”。
例如, 9>>2
得到 2:
9 (base 10): 00000000000000000000000000001001 (base 2)
--------------------------------
9 >> 2 (base 10): 00000000000000000000000000000010 (base 2) = 2 (base 10)
相比之下, -9>>2
得到 -3,因为符号被保留了。
-9 (base 10): 11111111111111111111111111110111 (base 2)
--------------------------------
-9 >> 2 (base 10): 11111111111111111111111111111101 (base 2) = -3 (base 10)
无符号右移(>>>)
该操作符会将第一个操作数向右移动指定的位数。向右被移出的位被丢弃,左侧用 0 填充。因为符号位变成了 0,所以结果总是非负的。
对于非负数,有符号右移和无符号右移总是返回相同的结果。例如 9>>>2
和 9>>2
一样返回 2:
9 (base 10): 00000000000000000000000000001001 (base 2)
--------------------------------
9 >>> 2 (base 10): 00000000000000000000000000000010 (base 2) = 2 (base 10)
但是对于负数却不尽相同。-9>>>2
产生 1073741821 这和 -9>>2
不同:
-9 (base 10): 11111111111111111111111111110111 (base 2)
--------------------------------
-9 >>> 2 (base 10): 00111111111111111111111111111101 (base 2) = 1073741821 (base 10)
-9 >> 2 (base 10): 11111111111111111111111111111101 (base 2) = -3 (base 10)
五、参考资源
MDN - 按位操作符
微机原理与接口技术