详解C语言变长数组

zsok 2022-08-13 发布于广东

展开全文

最近在做通信协议相关项目，在通信过程中一般都会有包长、数据缓冲等等信息；而实际场景中，数据包长度是不确定的，使用数组的定长包或者指针数据包都有一定的缺陷。那么，可变长的数据缓存方法有吗？

答案是有的，这就是0长度数组，又称为柔性数组（flexible array），通常用来实现变长数组。

变长数组简介

变长数组是数组大小待定的数组，C语言中结构体的最后一个元素可以是大小未知的数组，也就是所谓的0长度。

在标准C/C++中，不允许用0长度数组，但在GNU C中，却可以定义0长度数组(在C99之前写成长度为0，C99中可以直接不写索引)，我们可以用结构体来创建变长数组。

typedef struct {
    int len;
    int array[0];//int array[];
}SoftArray;

它的主要用途是为了满足需要变长度的结构体，为了解决使用数组时内存的冗余和数组的越界问题。

sizeof(SoftArray);的值在32位操作系统下刚好为4，也就是一个int型变量大小，这说明结构体中的数组没有占用内存。

对于编译器来说，此时长度为0的数组并不占用空间，因为数组名本身不占空间，它只是一个偏移量，数组名这个符号本身代表了一个不可修改的地址常量（注意：数组名永远都不会是指针）。

对于这个数组的大小，我们可以进行动态分配。

对于变长数组的这个特点，很容易构造出变成结构体，如缓冲区、数据包等等。

变长度数组的优缺点

这次的通信协议项目，假如使用数组来传递数据，那么一般定义如下，其中包的长度maxLen是一个定值，假设为1024。

typedef struct {
    int len;
    int array[maxLen];
}SoftArray;

这包数据的大小为sizeof(int) + sizeof(int) * maxLen，由于考虑到数据的溢出，maxLen一般会设置得足够长足以容纳最大的数据。因此，数组很多情况下可能都没有填满数据，造成了浪费。

而使用指针的话，则定义如下：

typedef struct 
{
    int len;
    char *array;
};

数据结构的大小为sizeof(int) + sizeof(int *)，使用指针结果作为缓冲区，只多使用了一个指针大小的空间，不会造成空间的大量浪费，但需要额外开辟和释放数据域的空间，我们并不能假定使用者了解我们开辟的细节，并按照约定的操作释放空间，因此使用起来多有不便，甚至造成内存泄漏。

变成数组可以节约空间，解决使用数组时内存的冗余和数组的越界问题。但也有一个缺点，那就是结构体中的变长数组只能放在最后面。

typedef struct {
    int len;
    int array[];
    int CRC;
}SoftArray;

这种用法是不行的，不支持，会报以下错误，如果后续要加上一些其他的数据就不能用了。

其实柔性数组成员在实现跳跃表时有它特别的用法，在Redis的SDS数据结构中和跳跃表的实现上，也使用柔性数组成员。

为什么0长度数组不占用存储空间

由于0长度数组是GNU C的扩展，有一些巧妙编写的诡异代码，其执行结果就是依赖于编译器和优化策略的实现的，我们来看看以下代码：

#include <stdio.h>
#include <stdlib.h>

int main(void)
{
    char a[0];
    printf('%p\n', a);

    char b[0];
    printf('%p\n', b);

    const char *c= 'Hello';
    printf('%p\n', c);

    const char *d = 'Hello';
    printf('%p\n', d);

    return EXIT_SUCCESS;
}

编译结果是：

可以看到a和b的地址就会被编译器优化到一处，因为a[0] 和 b[0] 对于程序来说是无法使用的，同样编译器对于相同字符串常量，往往地址也是优化到一处，减少空间占用。

所以其本质上涉及到的是一个C语言里面的数组和指针的区别问题，Programming Abstractions in C一书中提到：

“arr is defined to be identical to &arr[0]”.

也就是说，char a[1]里面的a实际是一个常量，即a = &a[0]。而char *b是有一个实实在在的指针变量b存在。所以，a=b是不允许的，而b=a是允许的。

#include <stdio.h>
char a[1];
char *b;

int main () {
 b = a; 
  //a=b会报错，incompatible types when assigning to type 'char[1]’ from type 'char *’
 a = b;
 return 0;
}

两种变量都支持下标式的访问，那么对于a[0]和b[0]本质上是否有区别？我们可以通过一个例子来说明。

变长数组和动态数组有什么区别？

动态数组是指在声明时，没有确定数组大小的数组，它可以随程序需要而重新指定大小。动态数组的内存空间是从堆动态分配的，当程序执行到我们编写的分配语句时，才为其分配存储空间。

使用动态数组的优点是可以根据用户需要，有效利用存储空间。

int a[10];//静态数组，在堆栈上创建

int n;
//C语言的malloc函数进行书写
int *p = (int *)malloc(n * sizeof(int));

变长数组的实际意思是以变量作为长度的数组，区别于以常数作为长度的数组。英文Variable-Length Array（后续都缩写成VLA），注意这里有一个连接号。

连接号-代表的意思是，Variable不是一个用于修饰Length的形容词，而是一个名字名词（即变量的意思）。

了解了正确的含义后，不难理解VLA的目的就是数组的长度是由一个变量指定的，而非常数。

小结

实际工程中不推荐使用VLA，程序中栈的大小是有限的，若需要的数组长度很大，有造成爆栈的危险。

END

作者：李肖遥

来源：技术让梦想更伟大

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： zsok > 《编程软件类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

zsok

关注对话

TA的最新馆藏

揭秘！港式/广式云吞面为什么味道那么独特
揭秘！港式/广式云吞面为什么味道那么独特
[转] 道家的十三虚无与佛家的十四无畏
佛学基础知识：菩提
境随心转相由心生
🍉立夏养生🥒

喜欢该文的人也喜欢更多

热门阅读换一换