高效的C编程之: 浮点运算
扫描二维码
随时随地手机看文章
14.10浮点运算
大多数的ARM处理器硬件上并不支持浮点运算。但ARM上提供了以下几个选项来实现浮点运算。
·浮点累加协处理器FPA(Floating-PointAccelerator):ARM上提供了一组协处理器指令专门实现浮点运算。但这需要硬件支持,具体某一处理器上是否有FPA协处理器支持,可以查看ARM相关手册。
·浮点运算仿真(FPE):使用软件仿真了FPA协处理器的执行。
·浮点运算库(FPLib):使用ARM的浮点运算库函数实现程序中的浮点运算操作。这就意味着C编译器要把每一个浮点操作转换成一个子程序调用。C库中的子函数使用整型运算来模拟浮点操作。这些代码是用高效的汇编语言编写而成的。尽管如此,浮点运算执行起来还是要比相应整型运算慢得多。
注意
Thumb指令不支持协处理器指令,所以在Thumb状态下实现浮点运算,只能调用ARM浮点运算库。
为了在ARM上高效地实现浮点运算,请遵循以下规则。
·避免使用浮点除法运算。通常情况下,除法运算的执行速度是普通加法或乘法运算速度的1/2。在无法避免除法的情况下,尽量使除法的除数为常数。如,x=x/3.0,可将其变为x=x*(1.0/3.0)。这样除数为常数(1.0/3.0),该值在编译阶段由编译器计算。
·使用float型代替double型。float型要比double使用更少的内存和寄存器。
·避免使用三角函数功能。实现三角函数功能,如sin、cos,使用了大量的乘加运算,它的运算速度大约是普通乘法运算的十倍。
·当编译器处理浮点运算操作时,由于精度的影响很多优化不能实现。比如,表达式3*(x/3),编译器不能判断其值和x是等价的。所以在使用浮点运算表达式时,最好先人工的做一些必要的优化。