什么是微型计算机的数制和编码
扫描二维码
随时随地手机看文章
在微型计算机中,所有信息(如数值、符号和图像等)均以二进制形式存储、传输和计算。由于二进制数冗长、不方便读写和辨认,因此,现代微型计算机也支持编程时使用书写长度更短的十六进制数和十进制数,同时也为各种非数值信息提供了相应的数值编码(即用数值表示非数值信息)方法。
数制
计算机应用中,最常用的数制有二进制(Binary)、十六进制(Hexadecimal)和十进制(Decimal)。本文将介绍这三种进制的数值表示方法,以及它们之间的转换方法。
1.进制数的表示和计算
二进制数由数字0和1表示,十进制数由数字0~9表示,而十六进制数则由数字0~9以及大写或小写的英文字母A、B、C、D、E和F表示。表1-1给出了部分二进制数、十进制数和十六进制数之间的对应关系。
数值通常以其数制的英文名称的开头字母(大、小写均可)为后缀,例如:10B、7FH和39D分别为二进制、十六进制和十进制数。十进制数的后缀字母D可以省略。进行加法计算时,二进制数、十进制数和十六进制数分别遵循“逢二进一”“逢十进一”和“逢十六进一”的原则。例如:1B+01B=10B;09D+1D=10D;09H+1H=0AH。
2.进制的转换
任意一个数an−1an−2…a0.a−1a−2…a−m,无论其以何种进制表示,都可以按照下式转换成对应的十进制数N:
式中,b为基数,二进制数、十进制数和十六进制数的基数分别为2、10和16;ai为数的第i位,是在0~(b-1)范围内的自然数;bi为该数第i位的权值;n和m分别为该数整数部分和
小数部分的位数。可见,将任意进制数转换为十进制数是一个加权求和的过程。例如,十六进制数0FAH=(0FH×161+0AH×160)=(15×16+10×1)=250D=250。
二进制数、十六进制数和十进制数之间的转换方法如图1-10所示。将十进制数转换为二进制数和十六进制数时,应重复进行除法,直到余数为0为止,并且各次除法所得的余数中,最先得到和最后得到的余数分别为转换结果的最低位和最高位,其他依此类推。
图1-10进制转换方法示意图
数据在计算机中的表示
数据可以分为无符号数和有符号数两类,其中无符号数的所有二进制位都是数值位,处理起来比较简单;而有符号数有正负之分,在计算机中表示和处理起来相对复杂。本节重点介绍几种常用有符号数的表达方式。
1.真值和机器数
计算机只能以二进制形式处理数据,包括代表数值正或负的符号“+”和“-”也只能用二进制数表示。在现代计算机中,通常将二进制数的最高位作为符号位以表示数的正负,该位为0代表正号,为1代表负号。这种将符号进行数值化表示的数被称为机器数,而其对应的原始数据被称为真值。
2.原码
原码就是机器数。通常用[X]原表示数据X的原码。例如,真值+18和-18所对应的8位机器数分别是[+18]原=00010010B和[-18]原=10010010B。另外计算机中存在+0和-0,[+0]原=00000000B、[-0]原=10000000B。
需要注意,在计算机中,数据所含二进制位的个数是有限的,受到CPU字长的限制。因此,将真值转换成机器数时,必须预先明确机器数的位数。这一点,在处理反码和补码时也同样要注意到。
在本书后面的章节中,若不做特别声明,则默认CPU的字长和数据的位数均为8位。
3.反码
正数的反码和原码相同。负数反码的最高位(即符号位)为1,其余位各位为原码各位按位取反。数据X的反码用[X]反表示。例如:[+18]反=00010010B;[-18]反=11101101B。+0和-0的反码不同,[+0]反=00000000B、[-0]反=11111111B。
4.补码
正数的补码与原码相同,通过以下两种方法可以得到负数X的补码:
1)[X]补=[X]反+1。
2)[X]补=2n+X。其中,n是二进制数的位数;2n为n位二进制数的“模”(可以理解为n位二进制数所能表示的不同的数的个数)。
对一个字长为n的CPU,若X>0,则(2n+X)的结果是X。因为,字长为n的CPU只能完成n位二进制运算。当加法结果大于模2n时,将产生进位,使得运算结果中超出模的部分被舍弃掉,而被舍弃掉的部分的数值大小为2n,进一步可知,对于任意整数m,(2n+m×X)的结果也是X。在数学上,这种情况被称为“同余”,即两个整数a和b除以同一个整数K后所得的余数相同,被称为a和b对于模K“同余”,记作:a(mod K)=b(mod K)。对于n位的CPU来说,在进行加减计算时,对于模2n同余的两个数之间并没有差别。
另外,设X和Y为整数,则补码还有以下运算规则:
1){[X]补}补=[X]原
2)[X+Y]补=2n+(X+Y)=2n+2n+(X+Y)=(2n+X)+(2n+Y)=[X]补+[Y]补
3)[X-Y]补=2n+(X-Y)=2n+2n+(X-Y)=(2n+X)+[2n+(-Y)]=[X]补+[-Y]补
若补码为8位二进制数,则[-18]补=28+X=256-18=238=11101110B。另外,也可以计算正
数的补码。例如:+18的8位二进制补码为[+18]补=28+18=18(mod 256)=18,需要说明的是,该计算过程的最后一个等号是成立的,因为8位二进制数计算过程中,第7位(最高位)的进位无法保存将被舍弃掉。
另外,根据补码的计算方法可知,+0和-0的补码相同,[-0]补=[+0]补=00000000B。
在现代微型计算机中,有符号数会自动被计算机转换成补码,并以补码的形式存放和参与计算。在补码计算过程中,符号位也参与计算,即便如此,也能得到正确的计算结果,并且引入补码后,可以将减法运算转换为补码的加法运算。
常用编码
在计算机中,常用的编码有BCD码和ASCII码。
1.BCD码
BCD码的英文表达为Binary Coded Decimal。顾名思义,BCD码是用二进制编码的十进制数,只能由0~9的数字构成,并且按照十进制的“逢十进一”法则进行运算。BCD码又分为压缩BCD码和非压缩BCD码两种,其中:压缩BCD码用4位二进制数表示1位十进制数;而非压缩BCD码用8位二进制数表示1位十进制数。另外,因为按照表1-1可以方便地进行4位二进制数与1位十六进制数的转换,并且与二进制数相比,十六进制数更易于书写和记忆,所以,在实际应用中通常将BCD码表示为十六进制数。
2.ASCII码
除了数值信息外,计算机还需处理字符、按键等非数值信息。而这些非数值信息也必须以二进制数的方式进行编码处理。ASCII码是美国信息交换标准代码(American Standard Code for Information Interchange)的简称,是一种应用广泛的编码方法。
每个ASCII编码均由7位二进制数构成,ASCII码表包含128个字符的ASCII码。这些字符可以分成两类,包括:①图形字符,这类字符可以打印和显示,如键盘上的英文字母“A”“B”和标点符号“,”“。”等;②控制类字符,这类字符不能被打印和显示,主要用于计算机的控制操作,如PC键盘上的键和键等。