Thumb指令集之: ARM和Thumb的混合编程
扫描二维码
随时随地手机看文章
Thumb以其较高的代码密度和在窄存储器上的性能,使得它在很多系统中得到广泛应用。但在很多情况下,还是不得不使用ARM指令,这是因为:
①ARM代码比Thumb代码有更快的执行速度;
②ARM处理器的一些特定功能必须由ARM指令实现,其中包括PSR指令、协处理器指令;
③异常发生时,处理器自动进入ARM状态,如果异常处理程序需要使用Thumb指令也必须通用一个ARM程序头(ARMassemblerheader)。
基于以上原因,即使程序需要由Thumb代码实现,也必须通过ARM-Thumb互交(ARM-Thumbinterworking)进入Thumb状态。
ARM-Thumb互交是指对汇编语言和C/C++语言的ARM和Thumb代码进行连接的方法,它进行两种状态(ARM和Thumb状态)间的切换。在进行这种切换时,有时需使用额外的代码,这些代码被称为Veneer。AAPCS定义了ARM和Thumb过程调用的标准。
从一个ARM例程调用一个Thumb例程,内核必须进行状态切换。状态的变化由CPSR的T位来显示。在跳转到一个例程时BX指令可用于ARM和Thumb状态切换,具体用法如下。
在Thumb状态调用ARM例程时,采用:
BXRn;
在ARM状态调用Thumb例程时,采用:
BX{cond}Rn;
其中,Rn可以是r0~r15中的任意寄存器。
这种带状态切换的跳转指令BX,将寄存器Rn的内容拷贝到程序计数器寄存器PC,因此可以实现4G空间的跳转。指令根据寄存器Rn的bit[0]来决定处理器是否进行状态切换,详细内容参见ARM指令一节。
下面是一段ARM程序,该程序调用虚拟的SWI_writeC子程序从存储器的固定地址取出字符串“helloworld”并输出。
AREAHello,CODE,READONLY
SWI_WriteCEQU&0 ;软中断调用参数
SWI_ExitEQU&11 ;程序退出软中断调用参数
ENTRY
STARTADRr1,TEXT ;取字符串地址
LOOPLDRBr0,[r1],#1 ;取下一字节内容
CMPr0,#0 ;判断是否为字符串尾
SWINESWI_WriteC ;软中断调用打印字符
BENLOOP ;循环
SWISWI_Exit ;软中断调用退出程序执行
TEXT=“HelloWorld”,&0a,&0d,0
END
下面的代码将上面的ARM代码转换成等价的Thumb代码。
AREAHelloW_Thumb,CODE,READONLY
SWI_WriteCEQU&0 ;软中断调用参数
SWI_ExitEQU&11 ;程序退出软中断调用参数
ENTRY ;程序入口点
CODE32进入ARM状态
ADRr0,START+1 ;取得Thumb代码入口地址
BXr0 ;进入Thumb代码
CODE16 ;Thumb代码入口点
STARTADRr1,TEXT ;r1->"HelloWorld"
LOOPLDRBr0,[r1] ;取下一字节内容
ADDr1,r1,#1 ;地址指针加1**T
CMPr0,#0 ;判断是否为字符串尾
BEQDONE ;完成?**T
SWISWI_WriteC ;如果不是字符串尾
BLOOP ;继续循环
DONESWISWI_Exit ;程序退出
ALIGN ;字对齐
TEXTDATA
"HelloWorld",&0a,&0d,&00
END
上例中,ARM代码到Thumb代码转换过程中新增加的指令用“**T”标注。
在实现ARM代码和Thumb代码转换时,大部分的ARM指令有等价的Thumb指令,只有少数指令没有。如加载字节指令(LDR)不支持自动变址,软中断指令不能条件执行。
在编写Thumb代码时要注意以下几点。
①汇编器需要知道什么时候产生ARM代码、什么时候产生Thumb代码,程序中使用CODE32和CODE16伪操作提供给编译器这些信息。
②由于处理器上电执行是在ARM状态下完成的,所以要使用Thumb指令必须由ARM指令调用Thumb指令,这一过程是通过“BXLR”指令来实现的。需要注意的是,在使用“BXLR”指令前,要对寄存器LR做正确的初始化。
③在ARM和Thumb混合编程时,常使用ALIGN伪操作保证内存地址对齐。
11.10.2互交子程序编写ARM/Thumb互交代码时,下面两点需要注意。
①对于C/C++子程序而言,只要在编译时指定--apcs/interwork选项,汇编器会生成合适的返回代码,使得程序返回到和调用程序相同的状态。
②在汇编语言子程序中,用户必须自己编写相应的返回代码,使得程序返回到和调用程序相同的状态。
如果目标代码包含以下内容,应该在编译或汇编时使用--apcs/interwork选项使处理器能够在ARM和Thumb代码间进行正确的切换,这种情况包含以下4种。
①需要返回到ARM状态的Thumb子程序。
②需要返回到Thumb状态的ARM子程序。
③间接调用ARM子程序的Thumb子程序。
④间接调用Thumb子程序的ARM子程序。
如果在程序连接阶段,连接器发现ARM子程序和Thumb子程序间存在相互调用,而源文件在编译时没有使用--apcs/interwork选项,则连接器将报告以下错误。
Error:L6239E:CannotcallARMsymbol'arm_function'innon-interworkingobject
armsub.ofromTHUMBcodeinthumbmain.o(.text)
其中,“arm_function”为需要进行状态切换的子程序名。
在这种情况下,用户必须使用--apcs/interwork选项重新对源文件进行编译。
但在下面两种情况下,不必指定--apcs/interwork选项。
①在Thumb状态下,发生异常中断时,处理器自动切换到ARM状态,这时不需要添加状态切换代码。
②当异常发生在Thumb状态时,从异常返回不需要添加状态切换的Veneer代码。
1.使用汇编语言实现互交对于汇编程序来说,可以有两种方法来实现程序状态的切换。第一种方法是利用连接器提供的交互子程序Veneer来实现程序状态的切换,这时用户可以使用指令BL来调用子程序;另一种方法是用户自己编写状态切换的程序。
在ARMv4版本及其以前的版本中,可以使用BX指令实现程序状态的切换。
从ARMv5版本开始,下面的指令也可以用来实现程序的状态切换。
·BX(BranchandeXchange)
·BLX、LDR、LDM和POP
下面的两个伪操作用来区分源程序中的ARM代码和Thumb代码。
·CODE16
·CODE32
下面简单介绍用于状态切换的指令和伪操作,更详细的信息请分别参见相关章节。
(1)BX指令
ARM状态下的BX指令,使程序跳转到指令中指定的参数Rm指定的地址执行程序,Rm的第0位拷贝到CPSR中T位,位[31∶1]移入PC。若Rm的bit[0]为1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码;若Rm的位bit[0]为0,则跳转时自动将CPSR中的标志位T复位,即把目标地址代码解释为ARM代码。指令的语法格式如下。
BX{<cond>}<Rm>
①<cond>
为指令编码中的条件域。它指示指令在什么条件下执行。当<cond>忽略时,指令为无条件执行(cond=AL(Alway))。
②<Rm>
包含跳转指令的目标地址。如果Rm的bit[0]=0,目标地址处指令为ARM指令;如果Rm的bit[0]=1,目标地址处指令为Thumb指令。
指令操作的伪代码。
指令操作的伪代码如下面程序段所示。
IfconditionPassed{cond}then
TFlag=Rm[0]
PC=RmAND0xfffffffe
Thumb状态下的BX指令,用于ARM和Thumb代码间的相互调用。
指令的语法格式。
BX<Rm>
其中<Rm>为目标地址寄存器,包含程序的跳转地址。BX指令的目标地址寄存器可以是r0~r15中的任意寄存器。
注意
如果Rm[1:0]=0b10,不满足ARM指令的内存对齐方式。指令的执行结果不可预知。如果该指令使用r15作为目标寄存器,其操作方式和使用其他寄存器相同。
指令操作的伪代码如下所示。
TFlag=Rm[0]
PC=Rm[31:1]<<1
ARM指令集中的BX指令和Thumb指令集中的BX指令相差较大,它们分别为不同方向的跳转。当r15作为目的寄存器使用时,要特别注意该指令在两个指令集中的区别。
(2)BLX指令
ARM状态下的BLX指令使用一个寄存器中的绝对地址或标号,用于使程序跳转到Thumb状态或从Thumb状态返回,该指令用分支寄存器的最低位来更新CPSR中的T位,并将返回地址写入到连接寄存器LR中。
指令的语法格式如下所示:
①BLX<target_addr>
②BLX{<cond>}<Rm>
第一种格式中,转移目标按下述方法计算。将指令中指定的24位偏移量进行符号扩展,左移两位形成字偏移量,然后将其累加进程序计数器PC中。这时,程序计数器的内容为BX指令地址加8字节。位H(bit[24])也加到结果地址的第一位(bit[1]),使目标地址为半字地址,以执行接下来的Thumb指令。计算偏移量的工作一般由ARM汇编器来完成。这种形式的跳转指令只能实现±32MB空间的跳转。
第二种格式中,寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。
·如果Rm的bit[0]=1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码。
·如果Rm的bit[0]=0,则跳转时自动将CPSR中的标志位T复位,即把目标地址的代码解释为ARM代码。
指令操作的伪代码如下面程序段所示。
第一种格式BLX指令。
LR=addressoftheinstructionaftertheBLXinstruction
TFlag=1
PC=PC+PC=PC+(SignExtend(signed_immed_24)<<2)+(H<<1)
第二种格式BLX指令。
IfConditionPass{cond}then
LR=addressoftheinstructionafterthebranchinstruftion
TFlag=Rm[0]
PC=RmAND0xfffffffe
Thumb状态下带返回链接的跳转指令BLX(1)提供了一种在Thumb状态下无条件调用ARM子程序的方法,当从子程序返回时,通常使用下面的方式之一:
·BXLR
·加载PC的LDR或LDM指令。
BLX指令不可条件执行,可以实现在大约±4MB的地址空间范围内跳转,实现方法是将一条BLX指令编译成两条16位的Thumb指令,从而实现上述跳转。对编译后的两条指令说明如下。
①H=10的跳转指令。该跳转包含跳转偏移量的高位部分。
②H=01的跳转指令。该跳转包含跳转偏移量的低位部分。
指令的语法格式
BL<target_address>
<target_address>
指定程序跳转的目标地址。指令通过下面的方法计算目标地址。
·将H=10的BL指令的offset_11域左移12位。
·将结果符号扩展为32位。
·将得到的值加到PC寄存器中。
·与H=11的BL指令的offset_11域相加。
因此BL指令可以实现在大约±4MB的地址空间范围内跳转。
指令操作的伪代码为:
ifH==10then
LR=PC+(SignExtend(offset_11)<<12)
ElseifH==11then
PC=LR+(offset_11<<11)
LR=(addressofnextinstruction)|1
ElseifH==01then
PC=(LR+(offset_11<<1))AND0xFFFFFFFC
LR=(addressofnextinstruction)|1
ElseifH==01then
PC=(LR+(offset_11<<1))AND0Xfffffffc
LR=(addressofnextinstruction)|1
TFlag=0
另外Thumb状态下包含另一种格式的BLX指令,该BLX(2)指令用于ARM和Thumb子程序间的相互调用。程序状态字的T标志位根据目的寄存器的bit[0]位而改变。
指令的语法格式为:
BLX<Rm>
其中<Rm>为目标地址寄存器,r0~r14寄存器均可以作为目标地址寄存器。
注意
如果在此指令中使用r15作为目的寄存器,指令的执行结果不可预知。
此指令只在ARMv5版本以上指令集中被支持。
指令操作的伪代码为:
LR=(addressoftheinstructionafterthisBLX)|1
TFlag=Rm[0]
PC=Rm[31:1]<<1
(3)汇编伪指令
汇编编译器可以产生ARM代码也可以产生Thumb代码。使用--thumb或--16选项指示编译器产生Thumb代码。由于所有支持Thumb代码的ARM处理器都从ARM状态开始执行,所以必须人为地使用BX或BLX指令,使处理器状态切换到Thumb状态并使用下面的伪操作使编译器产生Thumb代码。
·CODE16
·CODE32
CODE32伪操作指示汇编器后面的指令为32位的ARM指令。
ARM和CODE32伪操作的意义相同。
当汇编器对源程序进行编译时,如果需要,将会在程序中插入空指令,以保证内存单元字对齐。
语法格式如下。
ARM
CODE32
使用在同时包含ARM指令和Thumb指令的源文件中。当需要从ARM指令序列切换到Thumb指令序列时,使用伪操作ARM(或CODE32);当需要从Thumb指令序列切换到ARM指令序列时使用Thumb伪操作。ARM(或CODE32)伪操作只是指示汇编器后面的指令类型是ARM指令。该伪操作本身并不进行程序状态的切换,要进行状态切换,可以使用BX指令操作。
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。
语法格式如下。
CODE16
若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令。
(4)编程实例
PRESERVE8
AREAAddReg,CODE,READONLY ;段名为AddReg,属性为READONLY
ENTRY ;程序入口
;SECTION1
main
ADRr0,ThumbProg+1 ;确定跳转地址
;并将bit[0]置1
;使程序切换到thumb状态
BXr0 ;程序跳转并执行状态切换
;SECTION2
CODE16 ;Thumb代码指示伪操作
ThumbProg
MOVr2,#2 ;r2=2
MOVr3,#3 ;r2=3
ADDr2,r2,r3 ;r2=r2+r3
ADRr0,ARMProg
BXr0 ;程序跳转并执行状态切换
;SECTION3
CODE32 ;ARM代码指示伪操作
ARMProg
MOVr4,#4
MOVr5,#5
ADDr4,r4,r5
;SECTION4
stopMOVr0,#0x18 ;设置semihosting软中断号
LDRr1,=0x20026 ;ADP_Stopped_ApplicationExit
SWI0x123456 ;ARMsemihostingSWI软中断调用
END ;文件结束
上面的例子分为4部分,通过下面的步骤编译和运行。
①使用文本编辑器,如notepad,输入上面的代码,并保存成文件addreg.s;
②在命令行中键入汇编命令armasm–gaddreg.s;
③在命令行中键入链接命令armlinkaddreg.o-oaddreg;
④使用调试器(Debugger)(如,RealViewDebuggerorAXD)运行映像文件。可以使用单步执行,观察代码在Thumb状态下的执行。
注意
Thumb代码的地址标号如果用伪操作export声明为“外部的”,则连接器会自动调整该地址标号使其bit[0]等于1;如果该地址标号没有被声明为“外部的”,则使用者必须手动地对标号进行调整,如上例中的ThumProg+1。
(5)ARMv5架构下的状态切换
在ARMv5体系结构的指令集中,增加了下面两条指令用于ARM和Thumb代码互交。
·BLXaddress
该指令跳转到指令中指定的地址处执行程序并进行程序状态切换,该地址是“PC相关的”,地址范围为±32MB(ARM状态)或±4MB(Thumb状态)。
·BLXregister
在该中格式的跳转指令中寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。
使用上面两条指令,在执行程序跳转之前,处理器自动将返回连接寄存器LR的bit[0]位更新为CPSR寄存器的T位,所以无论处理器状态是否发生变化,程序都能正确返回。
当使用LDR、LDM及POP指令向PC寄存器中赋值时,寄存器CPSR中的Thumb位将被设置成PC寄存器的bit[0],这时就实现了程序状态的切换。这种方法在子程序的返回时非常有效,同样的指令可以根据需要返回到ARM状态或Thumb状态。
连接器在对目标代码进行连续时,将代码中的地址标号分为3类。
·ARM指令地址标号。
·Thumb指令地址标号。
·数据(Data)地址标号。
当连接器重定位Thumb代码中的地址标号时,地址标号的bit[0]位将被自动设置为1。这就意味着跳转指令(这些指令包括BX、BLX和LDR)可以根据目标地址正确的进行状态切换。
注意
上面提到的连接器自动设置目的地址的行为,只有在ARMv5及其以上版本中支持。
2.使用C和C++语言实现互交对于不同的C和C++源程序,可以有些程序中包含ARM指令,有些程序中包含Thumb指令,这些程序可以相互调用,只是在编译这些程序时指定--apcs/interwork选项。当使用了--apcs/interwork选项,编译器会自动进行一些相应处理;连接器在检测到程序中存在互交工作时,会生成一些用于程序状态切换的代码。
(1)代码编译
可以使用下面的指令,将C或C++程序编译为可以执行互交的目标代码。
armcc--c90--thumb--apcs/interwork
armcc--c90--arm--apcs/interwork
armcc--cpp--thumb--apcs/interwork
armcc--cpp--arm--apcs/interwork
注意
--cpp是C++文件(文件后缀为.cpp)默认的编译选项。
使用--apcs/interwork选项对文件进行编译时,编译器会进行如下处理。
·对于叶子程序(leaffunction,即程序中没有其他子程序调用的程序),编译器将程序中的“MOVPC,LR”指令替换成“BXLR”指令,因为“MOVPC”指令不能进行状态切换。
·对于非叶子程序,要进行一系列的指令替换,如:
POP{r4,r5,pc}
替换为:
POP{r4,r5}
POP{r3}
BXr3
下面的例子显示了一段带子程序调用的C语言程序,使用--apcs/interwork选项进行编译时,对代码产生的影响。
C语言源程序。
Voidfunc(void)
{
….
Sub()
..
}
使用armcc--apcs/interwork选项进行编译产生结果如下。
Func
STMFDsp!,{r4-r7,lr}
….
BLsub
….
LDMFDsp!,{r4-r7,lr}
BXlr
使用tcc--apcs/interwork选项进行编译产生结果如下。
PUSH{r4-r7,lr}
….
BLsub
….
POP{r4-r7}
POP{r3}
BX
(2)C语言的互交实例
下面的例子显示了一个Thumb状态下的代码通过互交调用ARM子程序;而后又在ARM子程序中调用Thumb指令集的库函数printf()。
/*********************
*thumbmain.c*
**********************/
#include<stdio.h>
externvoidarm_function(void);
intmain(void)
{
printf("HellofromThumbWorld\n");
arm_function();
printf("AndgoodbyefromThumbWorld\n");
return(0);
}
/*********************
*armsub.c*
**********************/
#include<stdio.h>
voidarm_function(void)
{
printf("HelloandGoodbyefromARMworld\n");
}
使用下面的命令对程序进行编译连接。
①编译生成带互交的Thumb代码。
armcc--thumb-c-g--apcs/interwork-othumbmain.othumbmain.c
②编译生成带互交的ARM代码。
armcc-c-g--apcs/interwork-oarmsub.oarmsub.c
③连接目标文件。
armlinkthumbmain.oarmsub.o-othumbtoarm.axf
另外,可以使用--info选项使连接器输出由于互交所增加的代码大小。
armlinkarmsub.othumbmain.o-othumbtoarm.axf--infoveneers
输出信息如下所示。
AddingVeneerstotheimage
AddingTAveneer(4bytes,Inline)forcallto'arm_function'fromthumbmain.o(.text).
AddingATveneer(8bytes,Inline)forcallto'__0printf'fromarmsub.o(.text).
AddingATveneer(8bytes,Inline)forcallto'__rt_lib_init'fromkernel.o(.text).
AddingATveneer(12bytes,Long)forcallto'__rt_lib_shutdown'fromkernel.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'__rt_memclr_w'fromstdio.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'__rt_raise'fromstdio.o(.text).
AddingTAveneer(8bytes,Short)forcallto'__rt_exit'fromexit.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'__user_libspace'fromfree.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'_fp_init'fromlib_init.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'__heap_extend'frommalloc.o(.text).
AddingATveneer(8bytes,Inline)forcallto'__raise'fromrt_raise.o(.text).
AddingTAveneer(4bytes,Inline)forcallto'__rt_errno_addr'fromftell.o(.text).
12Veneer(s)(total72bytes)addedtotheimage.
(3)Thumb状态下的功能指针
任何指向Thumb函数(由Thumb指令完成的功能函数并且其返回状态也为Thumb状态)的指针,其最低有效位(LSB)必为1。
当重定位Thumb代码中的地址标号时,连接器将自动设置地址的最低有效位。如果在程序中使用绝对地址,连接器将无法完成该设置。因此,如果在Thumb代码中使用绝对地址时,必须手工设置为其地址加1。
下面的例子显示了Thumb代码的功能指针的使用。
typedefint(*FN)();
myfunc(){
FNfnptrs[]={
(FN)(0x8084+1), //有效的Thumb地址
(FN)(0x8074) //无效的Thumb地址
};
FN*myfunctions=fnptrs;
myfunctions[0](); //调用成功
myfunctions[1](); //调用失败
}