单片机 认识HEX文件
扫描二维码
随时随地手机看文章
看过几篇常用指令的用法后,我们换换口味,介绍一下Intel 原厂所公布的HEX文件标准格式,相信经过本文的介绍,一定可以让您对8051的操作有更进一步的认识。以下是一个程序经编译器编译后所得到的HEX文件内容:
//Example.hex
行号 原始码
1 :10000000020003787FE4F6D8FD75812B02004A02D6
2 :10001000008FE493A3F8E493A34003F68001F20871
3 :10002000DFF48029E493A3F85407240CC8C333C435
4 :10003000540F4420C8834004F456800146F6DFE4A0
5 :10004000800B01020408102040809000C2E47E0171
6 :100050009360BCA3FF543F30E509541FFEE493A313
7 :1000600060010ECF54C025E060A840B8E493A3FAF7
8 :10007000E493A3F8E493A3C8C582C8CAC583CAF0B1
9 :10008000A3C8C582C8CAC583CADFE9DEE780BEE432
10 :10009000F52AF52BE52B25E02408F8E6F52808E6F7
11 :1000A000F529F590E528F5B07F707E171200E6057A
12 :1000B0002BE52B7002052AC39410E52A940040D446
13 :1000C00080CD20200800010002000400080010007C
14 :1000D0002000400080010002000400080010002001
15 :1000E000004000800000D3EF9400EE94004007EF42
16 :0700F0001F70F31E80F022D7
17 :00000001FF
面对这一大串的十六进制码,有没有头昏眼花的感觉呢?别急别急,经过本文的介绍,你一定会爱上这个会让你头昏眼花的机器码的!首先我们先介绍HEX文件的编码格式,举范例程序中第一行说明:
: 10 0000 00 020003787FE4F6D8FD75812B02004A02 D6
1 2 3 4 5 6
为了方便解说,笔者将原始码以空格区分成六个部分,在实际转换的原始内容应该没有空格也没有行号的。
第一部分是HEX文件的起始格式,文件一开始应该是一个冒号作为起点;
第二部分的两码(10H)所代表的是该行总共具备多少个字节的数据,以本行为例,应该有16个字节,因为10H换算成十进制应该是16;
第三部分的四码所代表的是放置数据的开始位置,换句话说,本行的数据应该是放置在0000H~000FH 这段地址中;
第四部分的两码是检查码,所代表的是该行有无数据存放,若有则为00H,若无则为01H;
第五部分则为数据存放区,总共32码16个字节,有兴趣的可以实际算算看,这里的机器码已经是标准的MCS-51指令,如果查表的话可以直接知道其功能,稍后的文章会再提到;
第六部分为Checksum值。
以上每一个数据行的标准格式,再看到最后一行,这是每一个HEX文件最后都会加上的一行,它所代表的意思也等于我们写程序的END差不多。当编译器看到这一段后,就不会再继续编译下去了。
问题来了,什么叫做Checksum值?它的功能是什么?很多人可能都有这样的疑问,所谓的Checksum值是一种标准的校验码,把它加在每一行机器码的最后,可以使每一行所有的十六进制值(两个为一组),加总后所得到最后两位十六进制码应为 00H,如果你不太会十六进制运算的话,没关系,Windows中有一个很好用的工具叫“计算器”,你可以切换到科学型计算的十六进制模式,将数值直接输入,它就会自动帮你算好了。以本例来说,将所有的值相加所得到的值应该是:
10H + 00H + 00H + 00H + 02H + 00H + 03H + 78H + 7FH + E4H + F6H + D8H+ FDH + 75H + 81H + 2BH + 02H + 00H + 4AH + 02H + D6H = 700H
最后两个码果然为00H,有兴趣的人可以把范例中的每一行都算算看,结果应该都是这样的。如果不是呢?那你的编译器一定是坏了,换一套安装吧!因为如果Checksum值不对的话,在连接的时候一定会出现ERROR,该文件根本就无法使用,到此为止,对Checksum值的重要性有更进一步的了解了吧!
刚刚我们提到可以利用HEX文件来看看原始程序是怎么写的,如果你手边没有纸笔跟MCS-51指令集的话,赶快去准备一份吧,接下来才是本文的精华所在呀!
同样以第一行为例,我们要看的地方是起始地址与数据区部分,也就是第三与第五部分,一开始先将起始位置写上,并写好第一组数值(如下所示)。
0000H 02
经查表得知02H为LJMP的指令,占用三个字节的空间,因此接下来的两个字节应该是其存放的地址数据,所以我们便将这两组数值填在02H的后面(如下所示)。
0000H 02 00 03
接下来把所查到的指令详细地写在右边(如下所示),如此便得到第一行程序了。
0000H 02 00 03 LJMP 0003H
接下来呢?重复刚才的顺序,先把起始地址写上,这时应该用掉三个字节,所以起始地址便移到了0003H,同样把0003H写上,再填上第一个数值(如下所示)。
0000H 02 00 03 LJMP 0003H
0003H 78
再经由查表,78H所代表的是MOV R0,#data,占用空间为两个字节,因此再将下一个字节的数值填上,并将该指令写在右边,如此便得到第二行程序(如下所示)。
0000H 02 00 03 LJMP 0003H
0003H 78 7F MOV R0,#7FH
开始有趣了,对不对?原来程序还可以这样子看,如此一来只要能够拿到 HEX文件,就等于知道了全部的原始程序了,不是吗?没错!大致上来说的确是如此的,而一般的反汇编程序也是利用这样的原理所写出来的,在旗威科技交流网中所提供的DIS51反汇编程序就是最好的例子。不过这其中还有很多的窍门,必须经过很多的尝试及多看别人的程序才能体会,本文就先介绍到此,陆陆续续我们会为您解开更多8051的神秘面纱。