《 C 语言的一些“骚操作”及其深层理解》之字符串的实质就是指针
扫描二维码
随时随地手机看文章
字符串是C语言中最基础的概念,也是最常被用到的。在嵌入式开发中,我们经常要将一些字符串通过串口显示到串口助手或调试终端上,作为信息提示,以便让我们了解程序的运行情况;或者是将一些常量的值转为字符串,来显示到液晶等显示设备上。
那么C语言中的字符串到底是什么?其实字符串本身就是一个指针,它的值(即指针所指向的地址)就是字符串首字符的地址。
为了解释这个问题,我经常会举这样一个例子:如何将一个数值转化为相应的16进制字符串。比如,把100转为”0X64”。
我们可以写这样一个函数:
没有问题,它的功能是正确的。在实现上,因为数值0~9和A~F在ASCII码值上并不连续(分别为0X30~0X39和0X41~0X46),所以程序中以9为分界,进行了分情况处理。
但聪明一些的编程者,可能用这样的方法来实现:
对,这是使用了查表的思想。虽然0~9和A~F,在ASCII码值上不连续,但是我们可以把它们放到一个数组里,创造一种连续。然后用数值作为下标,直接获取对应的字符。
也许会有人觉得Hex_Char_Table定义起来太麻烦,要一个个去输入字符。其实可以这样作:
我们将字符数组换成了字符串常量。其实它们在内存中的表达是几乎一样的,其实质都是内存中的字节序列。如图2.1所示。
图2.1 字符数组与字符串都是内存中的字节序列
不同点在于,字符数组在定义的时候要明确指定数组的大小,即它可以容纳多少个字符(字节)。而字符串的长度则以第一个等于0的字节为准。所以,字符串的字节序列中,一定有某一个字节的值为0,它就是字符串的结束符。我们平时使用的strlen这个函数,计算字符串长度的原理,其实就是在检测这个0。所以,如果我们拿一个没有0的字符数组(字节序列)传给strlen,那么最终的结果很可能是错误的,甚至因为数组越界访问,而导致程序的崩溃。
上面,振南说“字符串本身就是指针”,那么见证这句话真正意义的时刻来了,我们将上面程序继续简化:
Hex_Char_Table这个指针变量其实是多余的,“字符串本身就是指针”,所以它后面可以直接用[]配合下标来取出其中的字符。凡是实质上为指针类型(即表达的是地址意义)的变量或常量,都可以直接用[]或*来访问它所指向的数据序列中的数据元素。