c语言之共用体union、枚举、大小端模式

[导读]上一个专题我们详细的分享了c语言里面的结构体用法，读者在看这些用法的时候，可以一边看一边试验，掌握了这些基本用法就完全够用了，当然在以后的工作中，如果有遇到了更高级的用法，我们可以再来总结学习归纳。好了，开始我们今天的主题分享。一、共用体un

上一个专题我们详细的分享了c语言里面的结构体用法，读者在看这些用法的时候，可以一边看一边试验，掌握了这些基本用法就完全够用了，当然在以后的工作中，如果有遇到了更高级的用法，我们可以再来总结学习归纳。好了，开始我们今天的主题分享。

一、共用体union:

1、什么是共用体union?

这个共用体，估计大家平时在代码也比较少见，我去看了一下stm32的例程里面没怎么看到这个用法（下面的示例分享是在stm32里面找的）；其实这个共用体union（也叫联合体）跟我们上次分享的结构体定义是非常像的，比如说：类型定义、变量定义、使用方法上很相似。就像下面两个例子一样，把许多类型联合在一起（不过虽然形式上类似，但是具体用法还是有区别的，下面会讲他们之间的区别）：

union st{
   int a;
   char b;
};

2、共用体与结构体的区别：

结构体类似于一个包裹，结构体中的成员彼此是独立存在的，分布在内存的不同单元中，他们只是被打包成一个整体叫做结构体而已；共用体中的各个成员其实是一体的，彼此不独立，他们使用同一个内存单元。可以理解为：有时候是这个元素，有时候是那个元素。更准确的说法是同一个内存空间有多种解释方式。所以共用体用法总结如下：

union中可以定义多个成员，union的内存大小由最大的成员的大小来决定。
union成员共享同一块大小的内存，一次只能使用其中的一个成员。
对某一个成员赋值，会覆盖其他成员的值（这是为啥呢？，简单来讲就是因为他们共享一块内存。但前提是成员所占字节数相同，当成员所占字节数不同时只会覆盖相应字节上的值，比如对char成员赋值就不会把整个int成员覆盖掉，因为char只占一个字节，而int占四个字节）。
共用体union的存放顺序是所有成员都从低地址开始存放的。

3、代码实战：

    #include <stdio.h>

    typedef union{
        int a;
           char c;
          //int a;
         // int b;
  }st;
     int main(void)
    {
         st haha;
         haha.c='B';
        //  haha.a=10;
       //haha.b=60;

       printf("the haha size is %d\n",sizeof(haha));
       printf("haha.c=%d\n",haha.c);

       return 0;
}

#include <stdio.h>

 typedef union{

   int a;
   char c;
   int b;
 }st;
 int main(void)
 {

           st haha;
           haha.c='B';
           haha.a=10;
           haha.b=60;

           printf("the haha size is %d\n",sizeof(haha));
 printf("haha.c=%d,haha.a=%d,haha.b=%d\n",haha.c,haha.a,haha.b);

          printf("the a is 0x%x\n",&haha.a);
          printf("the c is 0x%x\n",&haha.c);
          printf("the b is 0x%x\n",&haha.b);


         return 0;
 }

演示结果：

   the haha size is 4
   haha.c=66

 the haha size is 4
 haha.c=60,haha.a=60,haha.b=60
 the a is 0x61feac
 the c is 0x61feac
 the b is 0x61feac

说明：

通过上面的代码示例，读者可以发现这个共用体的大小，并不是像我们之前结构体那样是把每个成员所占内存大小加起来，而是我们上面说的那样，共用体由成员占用内存大小最大的那个决定的，上面的示例中int 占用4个字节大小，为最大的，所以sizeof(haha)得出结果就是4个字节大小，而且读者细心可以发现到打印出来的结果a和b都是60，它是访问内存占用大小最大的那个成员的数值，因为那个'B'的acii码值是是66；通过示例，我们也发现共用体访问其成员方式跟结构体是一样的（上面也有说到过）。下面是和结构体做对比的代码示例：

       #include <stdio.h>
      // 共用体类型的定义
     struct mystruct
    {
           int a;
           char b;
     };
       // a和b其实指向同一块内存空间，只是对这块内存空间的2种不同的解析方式。
      // 如果我们使用u1.a那么就按照int类型来解析这个内存空间；如果我们使用 
     // u1.b那么就按照char类型
      // 来解析这块内存空间。
    union myunion
    {
       int a;
       char b;
       double c;
   };

   int main(void)
   {


        struct mystruct s1;
        s1.a = 23;
        printf("s1.b = %d.\n", s1.b);       // s1.b = 0. 结论是s1.a和s1.b是独立无关的
        printf("&s1.a = %p.\n", &s1.a);
        printf("&s1.b = %p.\n", &s1.b);

        union myunion u1;       // 共用体变量的定义
        u1.a = 23;  
        u1.b='B';
        u1.a=u1.b;          // 共用体元素的使用
        printf("u1.a = %d.\n", u1.a);
        printf("u1.b = %d.\n", u1.b);   
        printf("u1.c = %d.\n", u1.c);   
       // u1.b = 23.结论是u1.a和u1.b是相关的
       // a和b的地址一样，充分说明a和b指向同一块内存，只是对这块内存的不同解析规则    
        printf("&u1.a = %p.\n", &u1.a);
        printf("&u1.b = %p.\n", &u1.b);

        printf("the sizeof u1 is %d\n",sizeof(u1));

         return 0;
 }

演示结果：

s1.b = 22.
&s1.a = 0061FEA8.
&s1.b = 0061FEAC.
u1.a = 66.
u1.b = 66.
u1.c = 66.4、
&u1.a = 0061FEA0.
&u1.b = 0061FEA0.
the sizeof u1 is 8

4、小结：

union的sizeof测到的大小实际是union中各个元素里面占用内存最大的那个元素的大小。因为可以存的下这个就一定能够存的下其他的元素。
union中的元素不存在内存对齐的问题，因为union中实际只有1个内存空间，都是从同一个地址开始的（开始地址就是整个union占有的内存空间的首地址），所以不涉及内存对齐。

二、枚举

1、什么是枚举？

枚举在C语言中其实是一些符号常量集。直白点说：枚举定义了一些符号，这些符号的本质就是int类型的常量，每个符号和一个常量绑定。这个符号就表示一个自定义的一个识别码，编译器对枚举的认知就是符号常量所绑定的那个int类型的数字。枚举符号常量和其对应的常量数字相对来说，数字不重要，符号才重要。符号对应的数字只要彼此不相同即可，没有别的要求。所以一般情况下我们都不明确指定这个符号所对应的数字，而让编译器自动分配。（编译器自动分配的原则是：从0开始依次增加。如果用户自己定义了一个值，则从那个值开始往后依次增加）。

2、为什么要用枚举，和宏定义做对比：

(1)C语言没有枚举是可以的。使用枚举其实就是对1、0这些数字进行符号化编码，这样的好处就是编程时可以不用看数字而直接看符号。符号的意义是显然的，一眼可以看出。而数字所代表的含义除非看文档或者注释。

(2)宏定义的目的和意义是：不用数字而用符号。从这里可以看出：宏定义和枚举有内在联系。宏定义和枚举经常用来解决类似的问题，他们俩基本相当可以互换，但是有一些细微差别。

(3)宏定义和枚举的区别:

枚举是将多个有关联的符号封装在一个枚举中，而宏定义是完全散的。也就是说枚举其实是多选一。

(4）使用枚举情况：

什么情况下用枚举？当我们要定义的常量是一个有限集合时（譬如一星期有7天，譬如一个月有31天，譬如一年有12个月····），最适合用枚举。（其实宏定义也行，但是枚举更好）
不能用枚举的情况下（定义的常量符号之间无关联，或者无限的）,这个时候就用宏定义。

总结：

宏定义先出现，用来解决符号常量的问题；后来人们发现有时候定义的符号常量彼此之间有关联（多选一的关系），用宏定义来做虽然可以但是不贴切，于是乎发明了枚举来解决这种情况。

3、代码示例：

a、几种定义方法：

  /*        // 定义方法1，定义类型和定义变量分离开
   enum week
   {
            SUN,        // SUN = 0
            MON,        // MON = 1;
            TUE,
            WEN,
            THU,
            FRI,
            SAT,
  };

  enum week today;
  */

  /*        // 定义方法2,定义类型的同时定义变量
   enum week
   {
            SUN,        // SUN = 0
            MON,        // MON = 1;
                TUE,
                WEN,
            THU,
            FRI,
            SAT,
    }today,yesterday;
  */

   /*        // 定义方法3,定义类型的同时定义变量
     enum 
     {
            SUN,        // SUN = 0
            MON,        // MON = 1;
            TUE,  
            WEN,
            THU,
            FRI,
            SAT,
    }today,yesterday;
     */

    /*        // 定义方法4,用typedef定义枚举类型别名，并在后面使用别名进行变量定义
          typedef enum week
          {
            SUN,        // SUN = 0
            MON,        // MON = 1;
            TUE,
            WEN,
            THU,
            FRI,
            SAT,
          }week;
   */

  /*        // 定义方法5,用typedef定义枚举类型别名，并在后面使 
 用别名进行变量定义
        typedef enum 
        {
            SUN,        // SUN = 0
            MON,        // MON = 1;
            TUE,
            WEN,
            THU,
            FRI,
            SAT,
          }week;

b、错误类型举例（下面的举例中也加入了结构体作为对比）：

 /*    // 错误1，枚举类型重名，编译时报错：error: conflicting
//    types for ‘DAY’
      typedef enum workday
      {
             MON,       // MON = 1;
             TUE,
             WEN,
             THU,
             FRI,
       }DAY;

     typedef enum weekend
         {
            SAT,
            SUN,
         }DAY;
      */

     /*    // 错误2，枚举成员重名，编译时报错：redeclaration //of
  // enumerator ‘MON’
   typedef enum workday
      {
           MON,       // MON = 1;
          TUE,
          WEN,
          THU,
         FRI,
       }workday;

      typedef enum weekend
      {
         MON,
         SAT,
         SUN,
       }weekend;
     // 结构体中元素可以重名
     typedef struct 
     {
        int a;
        char b;
     }st1;

      typedef struct 
      {
         int a;
         char b;
      }st2;
      */

说明：

经过测试，两个struct类型内的成员名称可以重名，而两个enum类型中的成员不可以重名。实际上从两者的成员在访问方式上的不同就可以看出了。struct类型成员的访问方式是：变量名.成员，而enum成员的访问方式为：成员名。因此若两个enum类型中有重名的成员，那代码中访问这个成员时到底指的是哪个enum中的成员呢？所以不能重名。但是两个#define宏定义是可以重名的，该宏名真正的值取决于最后一次定义的值。编译器会给出警告但不会error，下面的示例会让编译器发出A被重复定义的警告。

 #include <stdio.h>
 #define A  5
 #define A 7

 int main(void)
 {
    printf("hello world\n");

   return 0;
  }

c、代码实战演示：

#include <stdio.h>

   typedef enum week
   {
         SUN,       // SUN = 0
         MON,       // MON = 1;
         TUE,        //2
         WEN,        //3
         THU,
         FRI,
         SAT,
   }week;

  int main(void)
  {



      // 测试定义方法4,5
        week today;
       today = WEN;
       printf("today is the %d th day in week\n", today);

       return 0;
  }

演示结果：

  today is the 3 th day in week

d、接着我们把上面枚举变量改变它的值（不按照编译模式方式来），看看会发生什么变化：

  #include <stdio.h>

  typedef enum week
 {
        SUN,        // SUN = 0
        MON=8,      // MON = 1;
        TUE,        //2
        WEN,        //3
        THU,
        FRI,
      SAT,
  }week;

      int main(void)
      {

          // 测试定义方法4,5
       week today,hh;
       today = WEN;
       hh=SUN;
       printf("today is the %d th day in week\n", SUN);
       printf("today is the %d th day in week\n", today);
       return 0;
  }

演示结果（我们可以看到改变了枚举成员值，它就在这个基础递增下面的成员值）：

        today is the 0 th day in week
        today is the 10 th day in week

注意：

这里要注意，只能把枚举值赋予枚举变量，不能把元素的数值直接赋予枚举变量，如一定要把数值赋予枚举变量，则必须用强制类型转换，但是我在测试时，发现编译器居然可以这样赋值，读者最好自己测试一下（不过这里后面发现在c语言里面可以这样操作，在c++里面不可以这样操作，必须强制类型转换）。
枚举元素不是字符常量也不是字符串常量，使用时不要加单、双引号。
枚举类型是一种基本数据类型，而不是一种构造类型，因为它不能再分解为任何基本类型。
枚举值是常量，不是变量。

三、大小端模式：

1、什么是叫大小端模式？

a、什么叫大端模式（big-endian）？

在这种格式中，字数据的高字节存储在低地址中，而字数据的低字节则存放在高地址中。

b、什么叫小端模式（little-endian）？

与大端存储格式相反，在小端存储格式中，低地址中存放的是字数据的低字节，高地址存放的是字数据的高字节。

2、实际解释：

----- 我们把一个16位的整数0x1234存放到一个短整型变量（short）中。这个短整型变量在内存中的存储在大小端模式由下表所示：

地址偏移	大端模式	小端模式
0x00	12	34
0x01	34	12

说明：

由上表所知，采用大小模式对数据进行存放的主要区别在于在存放的字节顺序，大端方式将高位存放在低地址，小端方式将低位存放在低地址。

3、代码实战来判断大小端模式：

#include <stdio.h>

    // 共用体中很重要的一点：a和b都是从u1的低地址开始的。
   // 假设u1所在的4字节地址分别是：0、1、2、3的话，那么a自然就是0、1、2、3；
  // b所在的地址是0而不是3.
    union myunion
    {
        int a;
        char b;
     };

    // 如果是小端模式则返回1，小端模式则返回0
      int is_little_endian(void)
     {
          union myunion u1;
          u1.a = 1;             // 地址0的那个字节内是1（小端）或者0（大端）
          return u1.b;
   }

  int is_little_endian2(void)
  {
         int a = 1;
         char b = *((char *)(&a));      // 指针方式其实就是共用体的本质

         return b;
 }


      int main(void)
      {
       int i = is_little_endian2();
      if (i == 1)
     {
           printf("小端模式\n");
     }
     else
    {
          printf("大端模式\n");
    }

        return 0;
    }

演示结果：

  这是小端模式

4、看似可行实则不行的测试大小端方式：位与、移位、强制类型转化：

    #include <stdio.h>


    int main(void)
    {
              // 强制类型转换
              int a;
              char b;
              a = 1;
              b = (char)a;
             printf("b = %d.\n", b);  // b=1

                   /*
                // 移位
                 int a, b;
                 a = 1;
                 b = a >> 1;
                 printf("b = %d.\n", b);    //b=0
                  */
               /*
       // 位与
        int a = 1;
        int b = a & 0xff;       // 也可以写成：char b
        printf("b = %d.\n", b);   //b=1  
     */


           return 0;
     }