C程序是如何跑起来的01 —— 可执行文件的构成
扫描二维码
随时随地手机看文章
ubuntu 20.04 使用 arm-linux-gnueabihf-gcc 7.5.0。
main.c:
calc.h:
calc.c:
编译:
交叉编译生成 a.out 可执行文件,文件类型是 32 位 ARM 平台可执行文件。
readelf 工具由编译器提供,用来列出关于可执行文件的内容的相关信息。
使用格式如下:
(1)查看可执行文件的头部 信息
(2)查看 section header
一个可执行文件由一系列 section 构成,section 称为段,包括:代码段 text、只读数据段 rodata、数据段 data、bss 段等。
每个 section 用一个section header描述,包括段名、段的类型、段的起始地址、段的偏移、段的大小等。
将可执行文件的所有 section header 集合到一起就是 section header table,使用 readelf 的-S参数查看的就是该表。
在程序编译的时候,对 C 语言代码中定义的函数、变量、未初始化的全局变量进行编译分类,放置在不同的段中:
BSS 段比较特殊,未初始化的全局变量和静态变量都会放置到 bss 段中,但因为这些变量的值都是 0,没有必要再开辟空间存储,所以在可执行文件中 bss 段是不占用空间的。
但是 BSS 段的大小、起始地址、各个变量的地址信息都会分别保存在 section header table 和符号表 symtab 中,当程序运行的时候,加载器会根据这些信息在内存中紧挨着数据段之后的空间,为 BSS 段开辟一片存储空间,为各个变量分配存储空间。
总而言之:BSS 段在可执行文件中不占用空间,在程序运行的时候才分配对应的空间。
如果在编译时开启了调试选项,则可执行文件中还会有 .debug section,用来保存可执行文件中每一条二进制指令对应的源码位置信息,根据这些信息,GDB 调试器就可以支持源码级的单步调试。
在最后环节,编译器还会在可执行文件中添加一些其它的 section,比如 .init section,这些代码来自 C 语言运行库的一些汇编代码,用来初始化 C 程序所依赖的环境。
学习目的
一、编译环境搭建
二、程序源码
#include
#ifndef _CALC_H_ #define _CALC_H_ int add(int a, int b); int sub(int a, int b); #endif
#include "calc.h" int add(int a, int b) { return a + b;
} int sub(int a, int b) { return a - b;
}
arm-linux-gnueabihf-gcc main.c calc.c
三、readelf 工具
Usage: readelf
四、可执行文件的组成结构
参考资料