C/C++中数据大小、字节对齐、内存占用

数据大小获取

sizeof（）操作符，求占用空间，对数组而言大小为 type大小 * 数据个数；
int a[] = {1,2,3,4,5}
sizeof(a) = 20
sizeof(&a) = 4
特殊的：在string时，由于字符串本质上就是自带‘\0’结尾的 char[] 数组，而char 的大小有恰好为1，
因此sizeof()就正好会是数组的长度；
在C++98中是不允许对类的非静态成员变量使用sizeof()的，而在C++11中是合法的；
根据 C99 规定，sizeof是一个编译时刻就起效果的运算符，运行时在其内的任何运算都没有意义；
int i = 10;
sizeof(i++); // 4 此时i=10, 并不会自加，里面的运算是无意义的;
int size = sizeof(Volume) / sizeof(Volume[0]); // Volume[0]并不起作用，只看其类型


strlen() 在对字符串计算时 以遇到'\0'结束符为准，不包含末尾的'\0' 字符（或内存中的内容为0）的长度的；
.length() （容器）字符串的长度，不包含结尾的'\0';
.size() （容器）字符串的长度'\0'；

strcpy() 拷贝函数其实是从指定位置覆盖，再加上‘\0’，而用%s输出就到'\0'为止。。。会在 最后自动 添加 '\0' 作为结束符，，

--------------------------------------------------------------------------------------
例题1：
    char dog[]="wang\0miao";
    cout << sizeof(dog) << endl;// 10
    cout << strlen(dog) << endl;// 4 
例题2    
    char str[] = "ab\012\\n";
    printf("%d \n", sizeof(str) );//6
    printf("%d \n", strlen(str) );//5
解释例题2 ：
\012 \0表示8进制(后面跟 <8 的数据的话) 此处表8进制的的10，也即ASIIC符号 \n ，同时\0也可表示字符串结束;
\\ 表示 斜杆;
最终字符为 a b \n \n \0
注：\ 表示转义字符标志;

例3
char c1[] ={'a', 'b', '\0', 'd', 'e'};
char c2[] ="hello";
sizeof(c1) strlen(c1); // 5 2
sizeof(c2) strlen(c2); // 6 5

例4
char *str1 ="hello";
char str2[] = "hello";
sizeof(str1) stelen(str1) // 4, 5(32位OS上，在64位OS上为：8， 5)
区别：str1是变量，str2是char const 类型；

注：sizeof(string)问题

string的实现在各库中可能有所不同，但是在同一库中相同一点是，无论你的string里放多长的字符串，它的sizeof()都是固定的，字符串所占的空间是从堆中动态分配的，与sizeof()无关。其大小跟编译器有关，VC6.0测试后sizeof(string)=16. DEV C++中为4。

字节对齐

需要字节对齐的根本原因在于CPU访问数据的效率问题。不仅是便于cpu快速访问，同时合理的利用字节对齐可以有效地节省存储空间

#pragma pack(n) // 指定内存对齐方式，往后的的代码什么的不按自身宽度对齐而是按指定宽度对齐；
#pragma pack() //  取消用户自定义字节对齐方式

#pragma pack的n值等于或超过所有数据成员长度的时候，这个n值的大小将不产生任何效果。

 __attribute((aligned (n)))，让所作用的结构成员对齐在n字节自然边界上。
如果结构中有成员的长度大于n，则按照最大成员的长度来对齐。
 __attribute__ ((packed))，取消结构在编译过程中的优化对齐，按照实际占用字节数进行对齐。


GCC默认按4字节对齐，

对于标准数据类型，地址只要是它的长度的整数倍就行了，而非标准数据类型按下面的原则对齐：

数组：按照基本数据类型对齐，第一个对齐了后面的自然也就对齐了。

枚举：只占4个字节；

联合体：大于等于其成员中最宽的成员，且是其他成员变量基本类型的整数倍；

结构体：结构体中数据成员都要对齐，且结构体整体也需要对齐（整体对齐为数据成员最大基本类型的整数倍）；

类：看下文；

内存占用

1、枚举eunm

对于enum变量，指一个被命名的整型常数的集合，本质上是一组（int型）常数，只占固定的 4 个字节；

定义格式：
    enum 枚举名 {枚举元素1, 枚举元素2, ……};
注意：第一个枚举成员的默认值为整型的 0，后续枚举成员的值在前一个成员上加 1。

enum season {spring, summer=3, autumn, winter};
没有指定值的枚举元素，其值为前一元素加 1。也就说 spring 的值为 0，summer 的值为 3，
autumn 的值为 4，winter 的值为 5

2、联合体union

所有成员相对于基地址均为0，共享一段内存，并且同一时间只能储存其中一个成员变量的值（即后面的赋值将覆盖前面的赋值）空间需足够宽（大于等于其成员中最宽的成员）且大小能被其包含的所有基本数据类型的大小所整除。

// GCC 默认 4字节对齐
union test{
    char s[9];      // 9
    int  a;         // 4
    double b;       // 8
};
sizeof( test );   //>=最宽数据成员9， 且同时是其他类型char（1）、（int）4和double（8）的整数倍， 因此为16

union test{
    char s[8];      // 8
    int  a;         // 4
    double b;       // 8
};
printf("%d\n", sizeof( test ) ); // >=最宽数据成员8， 且同时是其他类型char（1）、
（int）4和double（8）的整数倍， 因此为8

3、结构体struct

结构体各成员根据定义依次申请内存空间，其中包含数据成员自身对齐和结构体本身的对齐（整体对齐为数据成员中最大基本类型的整数倍）；

struct struct_test_1{
    char a;        // 1
    int b;         // 4
    double c;      // 8
}test1;
sizeof( test1 );   // 16 

struct struct_test_2{
    char a;          // 1
    double     b;    // 8
    int c;           // 4
    static int d;    // 存放在静态数据区，sizeof() 不计static所占用空间
}test2;
sizeof( test2 )      // 24
对struct_test_2分析：
    首先char a 申请一个字节空间，开辟首地址，之后double b存入; 它会认为内存是以自己的大小（double = 8 byte）来划分，
因此元素放置在自身宽度的整数倍开始（原则一），故b不从偏移1开始，因为不是整数倍，故中间填充7字节，此时消耗16字节，
再开辟int c，4 字节，是从4字节的整数倍开始，故消耗了20字节。此时存储单元不是最宽元素（8bytes）的整数倍，
故按最宽元素整数倍对齐（原则二）；一共消耗24 字节。

struct Data
{
    int a;          // 4
    float b;        // 4 
    double c;       // 8
    char d[21];     // 21
}data;    
printf("%d\n", sizeof(data) ); // 40 整体对齐为  数据成员最大基本类型（double）的整数倍



有些数据在存储时并不需要占用一个完整的字节，只需要占用一个或几个二进制位即可。
例如开关只有通电和断电两种状态，用 0 和 1 表示足以，也就是用一个二进位。
正是基于这种考虑，C语言又提供了一种叫做 位域 的数据结构。位域本质上是一种结构类型，
不过其成员是按二进制位分配的。并且其类型必须是int型，这就包括有符号和无符号的。

在结构体或是联合体定义时，我们可以指定某个成员变量所占的用的二进制(bit)位数，这就是位域。
位域的使用和结构体成员的使用相同，其一般形式为：
变量类型 位域变量名：位域  其中（位域变量名为可选项，）
    struct bs{
        int a:8;
        int b:2;
        int c:5;
    };
    printf("%d ", sizeof(struct bs) ); // 4
位域使用规则如下：
1、位域的宽度不能超过它所依附的数据类型的长度， 比如：unsigned int，长度为 4 个字节，数字就不能超过 32
2、位域可以无位域名，这时它只用来作填充或调整成员位置。因为没有名称，无名的位域是不能使用的。

位域存储规则如下：
1、依然遵循struct的 对齐规则；

2、当相邻成员的类型相同时，如果它们的位宽之和小于类型的 sizeof 大小，那么后面的成员紧邻前一个成员存储，
直到不能容纳为止；如果它们的位宽之和大于类型的 sizeof 大小，那么后面的成员将从新的存储单元开始，其偏移量为类型大小的整数倍。
    struct bs{
        int a:26;
        int b:2;
        int c:5;
    };
    printf("%d ", sizeof(struct bs) ); // 8
3、如果成员之间穿插着非位域成员，那么不会进行压缩。
  struct bs{
        int a:26;
        int b;
        int c:5;
    };
    printf("%d ", sizeof(struct bs) ); // 12
4、当相邻成员的类型不同时，不同的编译器有不同的实现方案，GCC 会压缩存储，而 VC/VS 不会。

实例1

struct A{
  int a;//4
  short b;//2+2
  int c;//4
  char d;//1+3
}; 
struct B{
  int a; // 4
  short b; // 2
  char d;// 1 + 1
  int c; // 4
};

sizeof(A) = 16, sizeof(B) = 12

实例2

struct foo{
    char a; // 1 + 3
    int b[10]; // 4 * 10
    char c;// +1
};// 48
void main_2()
{
    struct foo f={'X', {10,20,30,40,50,60,70,80,90}, 'F'};
    
    cout << "单个成员变量值" << endl;
    printf("%c %d %c \n", f.a, f.b[0], f.c);
    // cout << f.a<< " " << f.b[0]<< " " << f.c<< endl; // f.b[0] 输出是有错误的
        
    cout << "相对偏移量" << endl;
    printf ("sizeof() = %d\n", sizeof(foo) );
    printf ("offsetof(struct foo,a) is %d\n",(int)offsetof(struct foo,a));//输出 0
    printf ("offsetof(struct foo,b) is %d\n",(int)offsetof(struct foo,b));//输出 1
    printf ("offsetof(struct foo,c) is %d\n",(int)offsetof(struct foo,c));//输出 11
    
    cout << "相对地址" << endl;
    printf("struct          address:0x%x\n",&f);
    printf("struct member a address:0x%x\n",&(f.a) );
    printf("struct member b address:0x%x\n",&(f.b) );
    printf("struct member c address:0x%x\n",&(f.c) );
    
    cout << "\n用地址操作单个成员变量值" << endl;
    char *p = (char *)(&f);
    // 由于存在 字节对齐问题  
    printf("地址:%#x 内容:%c \n", p, *p);
    printf("地址:%#x 内容:%d \n", p+4, *(p+4) );
    printf("地址:%#x 内容:%d \n", p+8, *(p+8) );
    printf("地址:%#x 内容:%c \n", p+44, *(p+44) );
}

4、C++类（需考虑内存对齐问题，和struct类似）

a、空类占一个字节；

class A{
    
};
cout << "sizeof(A) "<< sizeof(A) << endl;// 1

b、数据成员所占内存按struct的计算方式计算（访问权限属性不影响存储，考虑到包含其他如struct、emun、union等复杂结构仍需先按自身类型对齐，在按class的算），其中static数据不是对象属性，而是类属性，其存储在数据区，sizeof 不计算其空间；

class A{
    int a;
    double c;
    char b;
    union{
        int aa;
        char bb[9];
        double cc;
    }test;
};
cout << "sizeof(A) "<< sizeof(A) << endl;// 40 = 4 + 4 + 8 + 1 + 7 + 16

c、不管是static还是非static成员函数，非虚成员函数均不占空间；

class B{
public:
    void func1(){}
    void func2(){}
};
cout << "sizeof(A) "<< sizeof(A) << endl;// 1

d、若存在虚函数，在类开辟的空间开始位置插入虚函数表（虚函数vptr指针），

所有同一个类的虚函数共享一个虚函数表，故一共占用4个字节；

class B{
public:
    void func1(){}
    void func2(){}
     virtual void func3() {}
     virtual void func4() {}
};
cout << "sizeof(A) "<< sizeof(A) << endl;// 4

e、继承时，在内存中，派生类所在位置在基类前面；

非虚继承情况下，不管基类存不存在虚函数，派生类会和基类均会共同使用一个虚函数表，

虚继承情况下，基类存在不存在虚函数，派生类的虚函数会共同使用派生类自己的虚函数表，

class B     
{  
private:
    char ch;     
    virtual void func0()  {  }   
};
class BB: public B  
{     
public:
    int e;     
    virtual void func0()  {  }   
    virtual void func1()  {  }  
};
class BB1: virtual public B  // 虚继承
{     
public:
    int e;     
    virtual void func0()  {  }   
    virtual void func1()  {  }  
};

      cout<< "sizeof(B)" << sizeof(B) <<endl; // 8
//    B的内存分布
//    4字节 虚表指针
//    1字节 ch
//    3字节 补齐，因为最大的字段（虚表长度）size为4，所以结构体补全成4的倍数
    
    cout<< "sizeof(BB)"<< sizeof(BB) <<endl; // 12
    cout<< "sizeof(BB1)"<< sizeof(BB1) <<endl; // 16

总结1：

1、结构体或联合体的数据成员对齐规则：

第一个数据成员放在ofset为0的地方，以后每个数据成员的对齐按照#pragmapack指定的数值和这个数据成员自身长度中，比较小的那个进行。

2、结构体或联合体的整体对齐规则：

在数据成员完成各自对齐之后，结构或联合本身也要进行对齐，对齐将按照#pragmapack指定的数值和结构或联合最大数据成员长度中，比较小的那个进行。

总结2：

1、基类对象的存储空间 = 非static数据成员大小 + 4字节虚函数表空间（若存在虚函数）；

2、派生类对象大小 = 基类对象大小 + 派生类独有的非static数据成员大小（注意复杂结构的字节对齐）（普通继承而非虚继承，派生类会与基类共享虚函数表）；

3、虚继承（在继承方式中加关键字virtual）的存储空间 = 基类对象大小 + 派生类独有的非static数据成员大小（注意复杂结构的字节对齐） + 每个类的虚函数存储空间；

虚继承

在多继承时，如果一个派生类从多个基类派生，而这些基类又有一个共同的基类，则在对该基类中声明的名字进行访问时，可能产生二义性。或者，如果在多条继承路径上有一个公共的基类，那么在继承路径的某处汇合点，这个公共基类就会在派生类的对象中产生多个基类子对象。

要使这个公共基类在派生类中只产生一个子对象，必须对这个基类声明为虚继承，使这个基类成为虚基类。

使用虚继承之后

C/C++中数据大小、字节对齐、内存占用

移位操作搞定两数之商

如何基于surging跨网关跨语言进行缓存降级

2024合集

程序员天天 CURD，怎么才能成长，职业发展的思考(2)

教你用Perl实现Smgp协议

如何通过前端表格控件在10分钟内完成一张分组报表？

win11关闭自动检测病毒删文件

通用代码生成器简介

lightdb 单机模式下数据库平移

千兆宽带实际网速能到达多少？

操作系統的大小端模式

回調函數指針函數數組指針指針數組

define typedef用法

C/C++ 內存分佈與管理

C/C++強制/自動類型轉換

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結