最简单bootloader的实现与分析

[导读] 学习嵌入式，我是从bootloader入手的。前些日子写了一个bootloader，趁今天有时间发出来，以记录自己实现的过程，巩固所学到的知识，并且希望给需要帮助的人带来一些灵感，如果有不对的地方，还望大家能

学习嵌入式，我是从bootloader入手的。前些日子写了一个bootloader，趁今天有时间发出来，以记录自己实现的过程，巩固所学到的知识，并且希望给需要帮助的人带来一些灵感，如果有不对的地方，还望大家能给予指正。

操作系统：Ubuntu 11.04 开发板：友善之臂mini2440 （如果用其它s3c2440或s3c2410 cpu的也差不多，大同小异）串口调试终端：minicom 编译器：GNU工具链

先修知识：arm汇编，c语言，GNU汇编的一些特殊伪指令，makefile，链接脚本等知识。对于我的这个bootloader，这些知识除C语言外，其它的能看得懂，会一些基本的东西就足够了。

学习一门知识最好的方法莫过于实践，只有通过自己的亲身体会，才能对知识有更加深刻的理解，才能更好的运用。现在的bootloader已经很强大了，比如最出名的u-boot，支持多种cpu架构和不同的开发板。我们听到最多，学得最多的也是bootloader的移植，但是为什么要这样移植，就不见得所有人都知道了。我之所以要亲手实现这样的一个很简单的bootloader也就是为了能够更好的掌握bootloader的原理。先说下我的bootloader所实现的功能：目前只是最基本的功能，支持串口调试、支持命令的交互，但是具体的命令由于对掌握bootloader原理没太大帮助就没有实现，对于linux内核的引导过程相对复杂许多，在这个bootloader中也不作实现。我的想法是越简单越好，不想做得太复杂。

代码组织结构模仿了u-boot，如下：

- bootloader

- board 存放与开发板相关的目录

- s3c2440 存放s3c2440 cpu 的一些与寄存器相关的定义文件

- cpu 存放不同cpu架构的目录

- arm920t 存放依赖于arm920t的相关文件

- drivers 存放一些驱动文件

- include 存放一些用到的头文件

程序源代码：http://download.csdn.net/detail/tianfangk/3621598

有关开发环境的配置等一些知识网上一大堆，这里就不再赘述，直接从bootloader执行过程的角度开始分析。首先，要对一个程序进行分析，必然要先看它的入口函数。对于如何找到入口函数，就要看程序的链接脚本了。每一个链接过程都由链接脚本(linker script，一般以lds作为文件的后缀名)控制。链接脚本主要用于规定如何把输入文件内的section放入输出文件内，并控制输出文件内各部分在程序地址空间内的布局。如果在程序的链接过程中没有指定链接脚本，则会使用连接器的默认内置连接脚本。我用得是自己的链接脚本link.lds文件，从中可以看出程序的入口函数在cpu/arm920t/init.S文件中，所以先从这个文件开始分析。

_start:
/* Interrupt Vector Table */
b start @ 0x00
ldr pc, undefined @ 0x04
ldr pc, software_interrupt @ 0x08
ldr pc, prefetch_abort @ 0x0C
ldr pc, data_abort @ 0x10
ldr pc, not_used @ 0x14
ldr pc, irq @ 0x18
ldr pc, fiq @ 0x1C

这一段是中断向量表，arm规定从0x00地址开始到0x1C为中断向量表，当程序被中断后，就会自动跳到这个地方，执行相应的中断处理程序。s3c2440 cpu上电后要执行的第一条指令在0x00000000处，所以将执行第一条指令：b start

接着pc就跳到start处：

start:
bl svc32_mod
bl off_wtdog
bl off_int
bl init_clk
bl init_cpu
bl init_sdram
bl init_gpb
#ifdef CONFIG_DEBUG
bl set_uart
#endif
bl copy_code
bl jmp_ram

这里作一些硬件的初始化工作，设置cpu的工作模式为svc32、关闭看门狗、屏蔽所有中断、初始化时钟、关闭mmu、初始化内存控制寄存器、初始化与led灯相关的gpio、如果要用到打印调试的话，还要初始化串口。说了这么多感觉好像有点让人眼花缭乱，其实原则只有一点，那就是你要用到什么硬件，就把它初始化到你想要的状态。只要把握住这一点就会觉得做这一切都十分合理，十分清晰。具体怎么初始化，就要参看cpu的芯片手册了，上面说得很详细。下面对部分需要说明的地方进行说明：

接下来要做的事情就是将flash上的代码拷贝到内存中运行了。关于这一部分，有必要说明一点，这也是s3c2440这块芯片的特别之处。通常我们是将程序烧写在nor flash 上，因为nor flash有独立的地址线和数据线，可以直接寻址，所以程序可以直接在nor flash上运行。但是nand flash 不同，它没有独立的地址线，因此不能直接寻址。所以s3c2440为了支持nand flash启动，在内部设有一块4K大小的SRAM，在S3C2440上电后，Nand Flash控制器会自动的把Nand Flash上的前4K数据搬移到内部SRAM中，并把这块SRAM映射到0x0地址处。由于我的这个bootloader总大小在4K之内，所以全部代码都可以直接被加载到内部SRAM中，为了简化过程，在copy_code过程中，我没有再进行对nand flash的操作，直接从SRAM也就是0x0地址处将代码copy到内存中，之后就执行jmp_ram这一过程，跳转到内存中运行。

但是这里有一个问题，也是我至今仍在困惑的问题，希望明白的朋友给解释一下。当代码从SRAM拷贝到内存完成的那一刻，存在了两处完全一样的代码，一处在SRAM中，一处在内存中。当cpu继续执行的时候，它是如何知道自己要从内存中去取那一条指令而不是SRAM？另外，代码复制到内存中，必然经过了一个重定向的工作，那么这一工作又是在何时完成的呢？

这一问题，先不管，接下来就要跳转到main函数中去了，这是一个C语言函数，必然会用到堆栈，所以在这之前要将堆栈指针设置好。C语言函数的可读性要强很多，就不用多说了。在main函数中，主要进行了对串口的初始化工作，最终程序将跳入到一个死循环wait_command中，反复重复一个动作：等待用户输入命令，然后执行命令。

这里还要说一下GPIO的问题，最初我在对串口进行初始化的时候，没有对相应的GPIO进行初始化（对于s3c2440，连接物理串口0的是GPH0~GPH7），导致无法将信息送到物理串口上，纠结了很长时间才查出错误。

总结一下：

1. 用到什么，就初始化什么；

2. 每写一行代码，都要保证其运行情况在你的掌控之下，千万不要写模棱两可的代码。

3. cpu的工作方式很简单：取指令，执行指令。不要让它猜你的意图。

做到这些，基本上可以保证程序不会出现大的错误。

到这里，对于这个bootloader的分析就完了，至于如何加载并启动内核，待以后有时间再续……