嵌入式软件程序HardFault异常的查找方法
扫描二维码
随时随地手机看文章
01
前言
在嵌入式软件开发中,因为代码质量不佳、线程冲突、栈溢出等问题,会造成Arm的HardFault。这种异常通常存在偶发性、不确定性、复现困难的特点,同时复现后软件已经跑飞,程序在何处异常、异常时的临时变量环境等都不好查找。在开发中出现此问题后往往意味着长时间的复现问题并debug,常常陷入毫无头绪的排查,耗费了不少程序员的头发。现总结了一些处理这类问题的经验以共享。
02
串口打印跟踪
在代码中插入串口打印,看死机时输出的最后一个串口信息在哪里。但是从代码里串口输出到硬件打印出数据,有一定延迟。出错的代码在最后输出的串口后边,无法确切定位。找到大概出错范围后根据经验验证代码,看有没有明显错误的地方。
03
仿真器追踪
在串口查找死机耗时大于两个小时的时候有必要使用仿真器追踪。
在代码中插入一个全局变量,每一个段给全局变量赋值。在中断的void HardFault_Handler(void)函数中设置断点。死机时进入断点查看全局变量的数值确定死机位置。
另外死机是可以view->call stack 中看到出错时调用的函数,以及函数中局部变量的值,通过这些信息推断出错原因。
04
通过堆栈查找最后一条语句
在中断HardFault_Handler中打上断点,程序跑飞后会停在此处:
在Registers里面找到R14(LR)的值。
在memory里面查找MSP的值:0x20008828,然后在对应的行里面找到地址:
在Disassembly里面右键选择Show Code at Address。搜索刚才得到的地址,就能找相对应的代码。这里的代码就是在进入循环中断之前的时候的情况,仔细查看这部分函数被调用或者数组内存使用情况。
05
避免问题
除零。
例如:
N = 0;Sum = 0;a;i < b;i ++) = { Sum += x[i]; N ++;}Sum /= N;
当a>b的时候,N为0,出错。
建议:在每个除法前都判断被除数是否为0。
if(N > 0){ Sum /= N;}
数据越界。
例如:
U8 x[100];N = 0;Sum = 0;和b由上文计算得出 非常量 a;i < b;i ++) = { Sum += x[i]; N ++;}
当b > 100时,数组越界。
建议:在调用数组前判断是否在数组范围内。
for(i = a;i < b;i ++){ if(b < 100) { Sum += x[i]; N ++; }}
被减数小于减数导致的越界。
U16 a,b,c;U8 x[100];a = b - c;//调用x[a]。当b
建议: 1. 减法判断减数与被减数大小
2. 在调用数组前判断是否在数组范围内。
栈溢出。
函数中的局部变量数组太大,超过了栈的大小。
建议:在大的局部变量前增加Static或者把局部变量改为全局变量。
中断与循环冲突。
中断与循环中同时写一个变量。程序设计时避免此写法。
任务冲突。
多个任务同时写入同一个变量 冲突。程序设计时避免此写法。
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!