ARM 系列 -- FS2410 开发板上启用 MMU 实现虚拟内存管理
扫描二维码
随时随地手机看文章
一、背景
FS2410 开发板上的 ARM 核心为 ARM920T, ARM920T 代表着什么呢? 其实ARM920T = ARM9 core + MMU + Cache,也就是说 ARM920T 为实现虚拟内存管理提供了硬件条件,这个硬件条件就是 MMU -- 内存管理单元。前面的实验我们程序里的地址都是直接对应物理地址,也就是说虚拟地址等同于物理地址,而今借助 MMU 我们可以实现虚拟内存管理,程序里面的地址不再被直接送到地址总线,而是先通过 MMU,由 MMU 来实现虚地址到物理地址的映射。这有什么意义?想象有这么两个程序,它们有相同的虚拟地址,但由于运行时其虚地址分别被映射到不同的物理地址,所以它们各行其道、和平共处,而不会产生冲突...有了 MMU 的支持我们可以设计出高级的作业系统。
二、目的
如何启用 MMU, 并实现虚拟地址到物理地址映射正是这次实验的目的。呵呵,你也许已经迫不及待...那现在我们就去探个究竟!
三、代码分析
程序的整个执行流程都体现在 start.S 文件里(以前不是 head.s文件吗? 呵呵,我把以前的代码进行了重构,现在代码看上去更清析--好的架构是很重要的,更便于以后的扩充),start.S里调用的函数有的是在 .c 文件实现的,必要时我会做相应解释。
1 .text
2 .global _start
3 _start:
4 b reset
5 NOP
6 NOP
7 NOP
8 NOP
9 NOP
10 ldr pc, handle_irq_addr
11 NOP
12 handle_irq_addr:
13 .long handle_irq
14 reset:
15 ldr r0, =0x53000000 @ Close Watch-dog Timer
16 mov r1, #0x0
17 str r1, [r0]
18
19@ init stack
20ldr sp,=4096
21
22@ disable all interrupts
23mov r1, #0x4A000000
24mov r2, #0xffffffff
25str r2, [r1, #0x08]
26ldr r2, =0x7ff
27str r2, [r1, #0x1c]
28
29bl memory_setup @ Initialize memory setting
30bl flash_to_sdram @ Copy code to sdram
31
32ldr pc, =run_on_sdram
33 run_on_sdram:
34ldr sp, =0x33000000
35 bl init_mmu_tlb @ setup page table
36 bl init_mmu @ MMU enabled
37
38msr cpsr_c, #0xd2 @ set the irq mode stack
39ldr sp, =0x31000000
40msr cpsr_c, #0xdf @ set the system mode stack
41ldr sp, =0x32000000
42bl init_irq
43msr cpsr_c, #0x5f @ set the system mode open the irq
44
45ldr sp, =0x33000000 @ Set stack pointer
46bl main
47 loop:
48b loop
(1) 设置中断跳转指令
可以看到程序 4~13 行用来设置中断跳转指令,目前我们只实现了响应 IRQ 中断的代码,所以在第 10 行处放了一条 ldr 加载指令,它的意思是当发生 IRQ 中断时,把用于响应 IRQ 中断的函数 handle_irq 的地址加载进 pc 寄存器让程序跳转那里进行相应处理
(2) 关闭看门狗,程序第 15~17 行
(3) 初始化堆栈寄存器体现在第 20 行,之所这么做因为下面会调用一些 C 函数,而 C函数里的变量当然要保存在堆栈里了
(4) 暂时不响应所有中断: 22~27 行
(5) 第 29 行,初始化内存(内存在这里就是 SDRAM) 慢着...程序不是已经运行在内存里了吗? 非也,准确点说是运行在 SRAM 里。ARM 启动时会将 Nand Flash(相当于硬盘)里前 4K 代码加载进 SRAM 里并运行之。那程序大于 4K 怎么办? 呵呵,这正是下一点要说明的
(6) 第 30 行,程序自身到内存的般移。我们的程序大于 4K, 只靠 SRAM 的那可怜的 4K是运行不开的
(7) 第 32~33 行,跳转到 SDRAM 里执行。我们的代码已经搬到内存了,64M 的空间够用的了
(8) 第 34~36 行,设置页表,启用 MMU。这是今天的主角。函数
init_mmu_tlb
init_mmu
定义在 mmu.c 文件里,我们去看看这个文件里有些什么?
1 /* init MMU page table*/
2 void init_mmu_tlb() {
3 unsigned long vm_addr, idx;
4 unsigned long *tb_base = (unsigned long *)MMU_TBL_BASE;
5
6 for (vm_addr = MEM_START; vm_addr < MEM_END; vm_addr += PAGE_SIZE) {
7 idx = vm_addr >> 20;
8 /* entry: section base, AP=0b11, domain=0b00,cached,write-through*/
9 *(tb_base + idx) = vm_addr|(0x3<<10)|(0<<5)|(1<<4)|(1<<3)|0x02;
10 }
11
12 /* set IO mapped-memory addr for function register*/
13 for (vm_addr = MEM_IO_MAPPED_START; vm_addr < MEM_IO_MAPPED_END; vm_addr += PAGE_SIZE) {
14 idx = vm_addr >> 20;
15 /* entry: section base, AP=0b11, domain=0b00, NCNB*/
16 *(tb_base + idx) = vm_addr|(0x03<<10)|(0<<5)|(1<<4)|0x02;
17 }
18
19 /*
20 * exception vectors
21 * entry: AP=0b11, domain=0b00, cached, write-through
22 */
23 *(tb_base + 0x00000000) = (0x00000000)|(0x03<<10)|(0<<5)|(1<<4)|(1<<3)|0x02;
24 *(tb_base + (0xffff0000>>20)) = VECTORS_PHY_BASE|(0x03<<10)|(0<<5)|(1<<4)|(0<<3)|0x02;
25 }
26
27 void init_mmu() {
28 unsigned long ttb = (unsigned long)MMU_TBL_BASE;
29 __asm__(
30 "mov r0, #0n"
31
32 /* disable ICache, DCache*/
33 "mcr p15, 0, r0, c7, c7, 0n"
34
35 /* clear wirte buffer*/
36 "mcr p15, 0, r0, c7, c10, 4n"
37
38 /* disable ICache, Dcache, TLBs*/
39 "mcr p15, 0, r0, c8, c7, 0n"
40
41 /* load page table pointer*/
42 "mov r4, %0n"
43 "mcr p15, 0, r4, c2, c0, 0n"
44
45 /*
46* write domain id (cp15_r13)
47 * domain=0b11, manager mode, no check for permission
48*/
49 "mvn r0, #0n"
50 "mcr p15, 0, r0, c3, c0, 0n"
51
52 /* set control register*/
53 "mrc p15, 0, r0, c1, c0, 0n"
54
55 /* clear out 'unwanted' bits*/
56 "ldr r1, =0x1384n"
57 "bic r0, r0, r1n"
58
59/*
60 * turn on what we want
61 * base location of exception = 0xffff0000
62*/
63 "orr r0, r0, #0x2000n"
64 /* fault checking enabled*/
65 "orr r0, r0, #0x0002n"
66 #ifdef CONFIG_CPU_DCACHE_ON
67 "orr r0, r0, #0x0004n"
68 #endif
69 #ifndef CONFIG_CPU_ICACHE_ON
70 "orr r0, r0, #0x1000n"
71 #endif
72 /* MMU enabled*/
73 "orr r0, r0, #0x0001n"
74
75 /* write control register*/
76 "mcr p15, 0, r0, c1, c0, 0n"
77 : /* no output*/
78 : "r"(ttb));
79 }
程序第 1~25 行是函数 init_mmu_tlb 的实现。其实就是建立一级页表。s3c2410 有四种内存映射模式: Fault、Coarse Page、Section、Fine Page. 为了简单起见我们用Section 模式。ARM920T 是 32 位的 CPU,其虚拟地址空间为 2^32 即 4G。 我们用Section 模式来划分这 4G 址址空间,每一个 Section 大小为 1M,这样就可得到 4K个 Section。怎样管理这些 Section 呢?通过一张表来记录它们,而这张表被称做页表。在页表里,用 4 个字节来记录一个 Section 的信息。总共有 4K 个 Section,这样就要花费 4x4K = 16K 的内存。这用来描述 Section 的 4 个字节也有个形象的名字,叫作描述符。描述符的结构又是什么样的呢。来看一下: