C程序里面嵌点"机器码"玩一玩"(小知识揭露大道理)
扫描二维码
随时随地手机看文章
1、来聊聊(轻松一刻)
最近热门的一句"淡黄的长裙,蓬松的头发......"来自上面这首歌,大家可以欣赏一下。最近挺忙的,不过还是时时刻刻想着跟大家带来一些让大家茅塞顿开的知识和干货,用小知识来揭开大秘密并且让大家收获满满这是作者想要达到的效果。好了,不啰嗦了,我也迫不及待的想讲解一下今天的内容了。
2、数电与程序的运行
学习嵌入式的各位小伙伴,都知道有两门必修基础课程就是《数字电路》和《模拟电路》,学完以后基本上就开始学习《微机原理》了,简单说说对这三者的理解:大家都知道我们的生活在一个模拟信号的世界,比如声音什么的都是连续的信号,我们需要对信号进行处理就需要用到我们的模拟电路,而我们人类的思维更趋向于数字逻辑,因为我们需要对信号进行一个描述,就拿我们用仪器测量长度,其实我们是永远无法精确的测量到长度到底是多少,所有的长度值都是在一定的误差之内进行表达的,数字就这样产生了,我们对数字的处理就需要数字电路了,说得绕,这里画个图吧,方便大家理解。
在数字电路中最典型的就是译码器等等,微机就是由非常多这种不同功能的数字电路组合形成的集合体。之前的文章说过,最终我们的高级代码会转成"0101"机器码供微机读取运行,那么这些机器码就相当于数字信号来触发微机一系列的运行来完成人类的思维逻辑,从而达到控制真实环境的目的。难道我随便给个"0101信号"数字电路都可以执行动作吗?答案肯定是不可以的。正所谓无规矩不成方圆,下面再具体跟大家聊聊。
3、汇编、指令集和机器码
比较早期的项目都是用汇编进行程序设计的,不过随着用户需求的不断增加汇编语言的开发速度、代码的可移植性、可读性等都难以满足要求,于是便有了高级语言的出现。现在的高级语言都会编译成汇编文件,汇编文件经过汇编器然后链接成我们的可执行文件。
汇编语句最典型的就是MOV指令了,可以认为是最简单的汇编指令把,基本上大部分指令集都会包含有对应的MOV指令,每条汇编指令都会对应着对应的机器码,可以说汇编指令就是为了标记机器码让我们大家能够识别,不然直接读机器码真的是太难了。第二小节我们说过机器码就相当于数字信号来触发微机系统一系列数字电路的动作,从而完成对应的功能。不同的汇编指令-->不同的机器码-->不同的数字信号-->不同的数字电路功能-->完成对应的工作;那么所有的汇编指令的集合就构成了指令集。不同的芯片一般有着不同的指令集,一般芯片功能比较复杂相应的指令集也会变得复杂。(配个图)
4、C程序嵌入机器码实现过程
好了,前面都是为后面进行的铺垫,这里正式开始今天的主题,大部分小伙伴应该对C语言里面嵌入汇编语言了解得比较多,比如nop语句,或者是_asm_("汇编指令");等等形式,不过嵌入机器码的可能见得不多,因为也没有必要,毕竟弄逆向的小伙伴也不多。这里主要是为了让大家更加进一步了解C语言和底层的关系以及程序的运行方式等等,所以拿这个进行讲解:
1)获得程序机器码
我们还是在Dev_C++5.7环境中编译一个加法程序并生成对应的exe可执行文件,参考代码如下:(再简单不过了!)
#include <stdio.h>
#include <stdlib.h>
/**********************************
* Fuction: main
* Author :(公众号:最后一个bug)
**********************************/
int main(int argc, char *argv[]) {
int a = Myadd(1,2);
printf("%X\n",Myadd);
printf("公众号:最后一个bug!\n");
return 0;
}
/**********************************
* Fuction: Myadd
* Author :(公众号:最后一个bug)
**********************************/
int Myadd(int a ,int b)
{
return (a + b);
}
我们把生成的exe文件,进行反汇编获得获得对应的机器码(注意:exe文件不仅仅全是程序的运行的机器码还包括一些程序信息,大家可以查阅相关资料)。
上面分别是"内存地址|机器码|对应的汇编语句",可以看到call调用了0X004016FD地址处的myadd加法函数;该函数具体实现如下图所示:
这样中间这一列就是对应的程序机器码了。哈哈,下一步我们就嵌入到C语言程序进行运行。
2)C程序运行我们的机器码
大部分小伙伴应该学习过函数指针,那么函数名其实就是对应的函数所在地址,我们只需要把上面的机器码放到我们的内存中,然后使用call指令进行运行岂不就可以使用我们的对应的机器码myAdd函数了?好,那么作者就实验一下:(还是在Dev_C++环境)
#include <stdio.h>
const unsigned char uBinCode[] = {
0x55,
0x89,0xE5,
0x8B,0x45,0x0C,
0x8B,0x55,0x08,
0x01,0xD0,
0x5D,
0xC3,
};
/**********************************
* Fuction: main
* Author :(公众号:最后一个bug)
**********************************/
int main(int argc, char *argv[]) {
printf("1 + 1 = %d\n",((int (*)(int,int))uBinCode)(1,1));
printf("5 + 5 = %d\n",((int (*)(int,int))uBinCode)(5,5));
printf("公众号:最后一个bug!\n");
return 0;
}
解析一下:我们把机器码变成byte放入到了数组中,为什么放入数组中?大家可以思考下,这样数组名就代表着这块数据的首地址,然后我们进行强制类型转化为函数指针便可以执行对应的机器码了。程序的运行结果如下:
5、最后小结
看到这里很多小伙伴应该对机器码还有C语言运行有了一个更加深刻的认识吧,还有里面有一些小小的思考是值得大家推敲一下,大家有时间可以自己实验一下,这里作者没有做特殊的解析,还是要留给大家更多的思考空间,便于大家学习进步。
授权转载自公众号:“最后一个bug”,作者:未知bug
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!