嵌入式C语言开发中数组越界问题分析
扫描二维码
随时随地手机看文章
因为C语言不检查数组越界,而数组又是我们经常用的数据结构之一,所以程序中经常会遇到数组越界的情况,并且后果轻者读写数据不对,重者程序crash。下面我们来分析一下数组越界的情况:
1) 堆中的数组越界
因为堆是我们自己分配的,如果越界,那么会把堆中其他空间的数据给写掉,或读取了其他空间的数据,这样就会导致其他变量的数据变得不对,如果是一个指针的话,那么有可能会引起crash
2) 栈中的数组越界
因为栈是向下增长的,在进入一个函数之前,会先把参数和下一步要执行的指令地址(通过call实现)压栈,在函数的入口会把ebp压栈,并把esp赋值给ebp,在函数返回的时候,将ebp值赋给esp,pop先前栈内的上级函数栈的基地址给ebp,恢复原栈基址,然后把调用函数之前的压入栈的指令地址pop出来(通过ret实现)。
栈是由高往低增长的,而数组的存储是由低位往高位存的 ,如果越界的话,会把当前函数的ebp和下一跳的指令地址覆盖掉,如果覆盖了当前函数的ebp,那么在恢复的时候esp就不能指向正确的地方,从而导致未可知的情况,如果下一跳的地址也被覆盖掉,那么肯定会导致crash。
所谓的数组越界,简单地讲就是指数组下标变量的取值超过了初始定义时的大小,导致对数组元素的访问出现在数组的范围之外,这类错误也是C语言程序中最常见的错误之一。
在C语言中,数组必须是静态的。换而言之,数组的大小必须在程序运行前就确定下来。由于C语言并不具有类似Java等语言中现有的静态分析工具的功能,可以对程序中数组下标取值范围进行严格检查,一旦发现数组上溢或下溢,都会因抛出异常而终止程序。也就是说,C语言并不检验数组边界,数组的两端都有可能越界,从而使其他变量的数据甚至程序代码被破坏。
因此,数组下标的取值范围只能预先推断一个值来确定数组的维数,而检验数组的边界是程序员的职责。
一般情况下,数组的越界错误主要包括两种:数组下标取值越界与指向数组的指针的指向范围越界。
一、数组下标越界简介
1、什么是数组访问越界?
在C语言中,我们可以直接通过数组下标来访问数组中的元素;
如果一个数组定义为有n个元素,那么,对这n个元素(下标为0 到 n-1的元素)的访问都合法,如果对这n个元素之外的访问,就是非法的,称为越界,例如:
int a[5] = {0}; //等价 int a[5] = {0,0,0,0,0};
a[0] = 1; // ok
a[1] = 2; // ok
a[2] = 3; // ok
a[3] = 4; // ok
a[4] = 5; // ok
a[5] = 6; // 数组下标越界
在上面代码中,声明一个数组a[5],该数组中只能存放5个元素,下标索引值取值范围0~4,超过这个范围就属于下标越界;
2、访问越界会出现什么结果?
首先,它并不会 造成编译错误!就是说,C,C++ 的编译器并不判断和指出你的代码访问越界了。一个明明是错误的东西,就这样“顺利”地通过了编译;
数组访问越界在运行时,它的表现是不定的,有时似乎什么事也没有,程序一直运行(当然,某些错误结果已造成);有时,则是程序一下子崩溃。因此在使用数组时,一定要在编程中判断是否越界以保证程序的正确性。
二、数组下标越界案例
#include
int main()
{
int i, a[10];
for(i = 1; i <= 10; ++i)
a[i] = 0;
return 0;
}
数组中的下标从0开始,那么在上面代码中只能访问:a[1]、a[2]、a[3]、a[4]、a[5]、a[6]、a[7]、a[8]、a[9];当i自加到10时,a[10]属于数组下标越界。
三、防止数组下标越界方法
如果数组的长度和下标访问值弄错,都会造成数组下标越界;数组的下标是从0开始的,最大的访问值是数组的长度-1;
//如果是整形数组
int len = sizeof(array)/sizeof(int);
//如果是字符数组
int len = sizeof(array)/sizeof(char);
//如果是浮点数数组
int len = sizeof(array)/sizeof(double);
//如果是浮点数数组
int len = sizeof(array)/sizeof(float);
for(int i = 0;i < len ; i++)
{
//.....
}
四、数组内存溢出简介
溢出:想象一个桶,桶的容积是有限的,你装满了水以后,如何还要往里面装,那么水就溢出到地面了。
C语言中的溢出和这个原理一样,桶的容积就表示你定义的某一数据的内存大小,往里面写入数据就表示在装水。
案例一:一个计时器,最大计 100s 的时,你让他跑了 120 秒,它就溢出了;
案例二:两个 unsigned char,一个200,一个也是200,相加,结果也就溢出,因为 unsigned char 最大就 255 ;