用C语言编程节省存储空间的方法分析
扫描二维码
随时随地手机看文章
在C语言中,联合体(Union)是一种特殊的复合数据类型,它允许在一个相同内存区域中存储不同类型的数据,但任何时候只能存储其中一种类型的数据。通过使用联合体,可以节省存储空间,因为所有成员共享同一块内存,而非为每个成员分配独立的空间。
例如,假设我们有一个场景,需要存储一个既可以表示整数也可以表示浮点数的变量,而且我们知道在任何时刻只需要存储其中一种数据类型。此时,可以使用联合体来实现,这样就不需要为整数和浮点数分别分配内存空间,而是共享一块内存。
大家都知道进行单片机编程和计算机编程有个最大的差别就是单片机的资源非常的有限,并且对于大部分低端单片机而言都没有操作系统。除了一些嵌入式级的芯片用了Linux系统外,其他大部分操作都是比较简单的RTOS,可能还有一些简单的应用或者芯片根本不用系统,直接是裸机程序。
不过大部分单片机编程都与硬件密切的结合,这样工程师能够对当前的项目对象有更多的把控能力和理解能力。但是由于它的简单,我们平时在工作中往往需要控制一个项目的成本,对于单片机的选型和资源的评估都是非常谨慎;同样随着我们项目功能的不断扩展,也会让系统程序逐步变得庞大,这时候资源的使用就更需要节约点用了。
所以当资源受限制(一般的单片机RAM也就Kb级别),比如说单片机RAM不够了,即使你有再牛的算法可能也无法加入到项目中来,那么有些同志们会问,那换芯片不就可以了吗?我只想说这位同志你想多了,对于不怎么热卖产品或者不规范的公司可能还允许你试一试,可是一般的公司项目卡着走的,换了主控芯片,暂且不说软件上的移植工作,换了芯片成本上必定增加,产品的测试都得重新规划,老板领导可不愿意了。
那么主控芯片换不了我们还有什么办法呢?那我们应该从原本的程序中挤出资源来使用了,下面我总结了几种常总方法供大家参考。(具体内容可以网络查找)
共联体-union
union-共联体,是C语言常用的关键字。从字面上的意思就是共同联合在一起的意思,union所有的成员共同维护一段能够内存空间,其内存的大小取决于所有成员中占用空间最大的成员。
union结构体由于是共用同一片内存可以大大节省内存空间,那一般什么情况下使用union?又或者union还有什么特点?下面我将用几点为大家解答。
1)所有的union的成员及本身的地址是一样的。
2)union的存储模型受大小端的影响,我们可以通过下面的代码进行测试。(如果输出结果为1,表示小端模式,否则为大端模式)
大小端小知识
大端模式(Big_endian):一个数据的高字节存储在低地址,低字节存储在高地址。其指针指向的首地址位于低地址。
小端模式(Little_endian):一个数据的高字节存储在高地址,低字节存储在低地址。其指针指向的首地址位于高地址。
3)union不同于结构体struct,union对成员的改变可能会影响到其他成员变量,所以我们要形成一种互斥使用,比如说我们的顺序执行其实就是每个代码都是互斥的,所以我们可以用union进行函数处理缓存等。(个人觉得也可以认为是分时复用,并且是不会受内存初值影响的处理)
内存安全:C语言中的内存安全是指程序员必须确保他们的程序不会读取或写入未分配或已释放的内存。这可以通过使用指针和动态内存分配来实现,但需要小心操作,避免发生内存泄漏或悬挂指针等问题。
位域
位域可能对于初学者用得比较少,不过对于大部分参加工作的工程师应该屡见不鲜了,确实它也是我们省内存的神器。
因为在我们平时编程过程中,我们使用的变量与实际情况是息息相关的,就比如说开关的状态,我们一般就是0或者是1分别表示打开和关闭,那么我们用一个bit就能表示,假如说我们用一个char来存储就几乎浪费了7个bit,如果以后也有类似的的情况,那么大部分内存都得不到有效的应用。所以C语言的位域就是用来解决这个问题。
不过我们需要注意如下几点:
1)位域是在结构体中实现的,其中位域规定的长度不能超过所定义类型,且一个位域只能定义在同一个存储单元中。
2)无名位域的使用,可以看下面的代码。
3)由于位域与数据类型有关系,那么他的内存占用情况也与平台的位数相关。(相关内容可网络查找)
结构体对齐
结构体对齐问题可能大部分人关注的不是很多,可能在通讯领域进行内存的copy时候接触得比较多。结构体对齐问题也是与平台相关,CPU为了提高访问内存的效率,一次性可能读取2个字节,4个字节,8个字节等,所以编译器会自动对结构体内存进行对齐。
废话不多说,代码说明一切:
算法优化
算法优化其实主要是我们通过修改一些算法的实现一种效率与内存使用的一个平衡,我们都知道我们的算法都存在着复杂度的问题,我们大部分高效率的算法都是通过使用内存来换效率,也就是一种用空间换时间的概念。那么当我们内存使用有限的时候我们可以适当的用时间来换空间的方法,腾出更多的空间来实现更多的功能。
同样我们在进行相关设计的时候可以尽量使用局部变量来减少全局变量的使用!
C语言的共用体union
共用体是一种特殊的数据类型,允许您在相同的内存位置存储不同的数据类型。
什么意思呢,就是在同一块内存存储可以定义多个数据类型,但是在使用的时候,只有一个变量有效。
这里就有一个问题,变量有大有小呀,对的,所以这个时候共用体的空间为内部变量最大占用空间的值。
如此这般,共用体就可以通过共享存储空间,来避免当前没有被使用的变量所造成的存储空间的浪费。
共用体的成员可以使用任何数据类型,但是一个共用体所占用的存储空间的字节总数,必须保证至少足以能够容纳其占用空间字节数最大的成员。并且共用体每次只允许访问一个成员,也就是一种数据类型,确保按照正确的数据类型来访问共用体中的数据,就是你的责任了。
是否还有办法压缩内存呢?
或许有人会提出修改默认对齐字节数,但这绝对不是一个好主意,因为CPU对奇地址内存读取会占用两个总线周期,而偶地址只需要一个。如果改为1字节对齐,那么就会存在有的变量的地址是奇地址,这会影响程序执行效率,绝非专业人士所愿。
下面介绍一种极客方法。
之前我们提到过,32位下是4字节对齐的,那么其实我们的结构体的地址(例如next指针指向的下一个connnection结构的地址)的低位最后两比特就一定为0。
既然有常为0的比特位,我们何不利用起来,针对上例,我们可以去掉closed变量,此时代码形如:
typedef struct connection_s {
int sockfd;
chain_t *recv_chain_head;
chain_t *recv_chain_tail;
chain_t *send_chain_head;
chain_t *send_chain_tail;
struct connection_s *next;
} connection_t;
1
2
3
4
5
6
7
8
似乎我们缺少了一个位域变量,无法完成closed标记了。但next后两位常年为0,我们可以利用其最后一位来替代closed位变量,做法形如:
connection->next |= 0x1;
1
而在以后如有需求遍历整个链的时候,我们可以如下做:
connection_t *next, *c = connection_head; //假设是connection_head全局变量
while (c != NULL) {
next = c->next & 0xfffffffc;
//一些操作
c = next;
}
1
2
3
4
5
6
这里看似我们是利用额外的位运算来取代了位变量所带来的对齐开销,但是通常情况下,由于位运算单指令即可完成且指令复杂度极低,因此运算效率也是非常高的,是非常划算的。