深度分析C語言和其他高級語言的區別

提到C語言,我們知道c語言和其他高級語言的最大的區別就是C語言是要操作內存的!

我們需要知道——變量,其實是內存地址的一個抽像名字罷了。在靜態編譯的程序中,所有的變量名都會在編譯時被轉成內存地址。機器是不知道我們取的名字的,只知道地址。

內存的使用時程序設計中需要考慮的重要因素之一,這不僅由於系統內存是有限的(尤其在嵌入式系統中),而且內存分配也會直接影響到程序的效率。因此,我們要對C語言中的內存管理,有個系統的瞭解。

在C語言中,定義了4個內存區間:代碼區;全局變量和靜態變量區;局部變量區即棧區;動態存儲區,即堆區;具體如下:

1、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。

2、堆區(heap) — 一般由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回收 。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表,呵呵。

3、全局區(靜態區)(static)—全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域, 未初始化的全局變量和未初始化的靜態變量在相鄰的 另一塊區域。 - 程序結束後由系統釋放。

4、常量區 —常量字符串就是放在這裏的。 程序結束後由系統釋放

5、程序代碼區—存放函數體的二進制代碼。

我們來看張圖:

image

首先我們要知道,源代碼編譯成程序,程序是放在硬盤上的,而非內存裏!只有執行時纔會被調用到內存中!

我們來看看程序結構,ELF是是Linux的主要可執行文件格式。ELF文件由4部分組成,分別是ELF頭(ELF header)、程序頭表(Program header table)、節(Section)和節頭表(Section header table)。具體如下:

1、Program header描述的是一個段在文件中的位置、大小以及它被放進內存後所在的位置和大小。即要加載的信息;

2、Sections保存着object 文件的信息,從連接角度看:包括指令,數據,符號表,重定位信息等等。在圖中,我們可以看到Sections中包括:

(1)  .text   文本結 存放指令;

(2)  .rodata   數據結  readonly;

(3)  .data  數據結 可讀可寫;

3、Section頭表(section header table)包含了描述文件sections的信息。每個section在這個表中有一個入口;每個入口給出了該section的名字,大小,等等信息。相當於 索引!

而程序被加載到內存裏面,又是如何分佈的呢?我們看看上圖中:

1、正文和初始化的數據和未初始化的數據就是我們所說的數據段,正文即代碼段;

2、正文段上面是常量區,常量區上面是全局變量和靜態變量區,二者佔據的就是初始化的數據和未初始化的數據那部分;

3、再上面就是堆,動態存儲區,這裏是上增長;

4、堆上面是棧,存放的是局部變量,就是局部變量所在代碼塊執行完畢後,這塊內存會被釋放,這裏棧區是下增長;

5、命令行參數就是$0 $1之類的,環境變量什麼的前面的文章已經講過,有興趣的可以去看看。

我們知道,內存分爲動態內存和靜態內存,我們先講靜態內存。

一、靜態內存

內存管理—存儲模型

存儲模型決定了一個變量的內存分配方式和訪問特性,在C語言中主要有三個維度來決定:1、存儲時期 2、作用域 3、鏈接

1、存儲時期

存儲時期:變量在內存中的保留時間(生命週期)

存儲時期分爲兩種情況,關鍵是看變量在程序執行過程中會不會被系統自動回收掉。

1)  靜態存儲時期 Static

在程序執行過程中一旦分配就不會被自動回收。

通常來說,任何不在函數級別代碼塊內定義的變量。

無論是否在代碼塊內,只要採用static關鍵字修飾的變量。

  1. 自動存儲時期  Automatic

除了靜態存儲以外的變量都是自動存儲時期的,或者說只要是在代碼塊內定義的非static的變量,系統會肚臍自動非配和釋放內存;

2、作用域

作用域:一個變量在定義該變量的自身文件中的可見性(訪問或者引用)

在C語言中,一共有3中作用域:

1)  代碼塊作用域

在代碼塊中定義的變量都具有該代碼的作用域。從這個變量定義地方開始,到這個代碼塊結束,該變量是可見的;

2)  函數原型作用域

出現在函數原型中的變量,都具有函數原型作用域,函數原型作用域從變量定義處一直到原型聲明的末尾。

3)  文件作用域

一個在所有函數之外定義的變量具有文件作用域,具有文件作用域的變量從它的定義處到包含該定義的文件結尾處都是可見的;

3、鏈接

鏈接:一個變量在組成程序的所有文件中的可見性(訪問或者引用);

C語言中一共有三種不同的鏈接:

1)  外部鏈接

如果一個變量在組成一個程序的所有文件中的任何位置都可以被訪問,則稱該變量支持外部鏈接;

2)  內部鏈接

如果一個變量只可以在定義其自身的文件中的任何位置被訪問,則稱該變量支持內部鏈接。

3)  空鏈接

如果一個變量只是被定義其自身的當前代碼塊所私有,不能被程序的其他部分所訪問,則成該變量支持空鏈接

我們來看一個代碼示例:

[cpp] view plain copy

1. #include <stdio.h>  </stdio.h>

2.

3. int a = 0;// 全局初始化區

4. char *p1; //全局未初始化區

5.

6. int main()

7. {

8. int b; //b在棧區

9. char s[] = “abc”; //棧

10. char *p2; //p2在棧區

11.

12. char *p3 = “123456”; //123456\0在常量區,p3在棧上。

13. static int c =0; //全局(靜態)初始化區

14.

15. p1 = (char *)malloc(10);

16. p2 = (char *)malloc(20);  //分配得來得10和20字節的區域就在堆區。

17.

18. strcpy(p1, “123456”); //123456\0放在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方。

19. }

二、動態內存

當程序運行到需要一個動態分配的變量時,必須向系統申請取得堆中的一塊所需大小的存儲空間,用於存儲該變量。當不在使用該變量時,也就是它的生命結束時,要顯示釋放它所佔用的存儲空間,這樣系統就能對該空間 進行再次分配,做到重複使用有線的資源。下面介紹動態內存申請和釋放的函數。

1.1 malloc 函數

malloc函數原型:

[cpp] view plain copy

1. #include <stdio.h>  </stdio.h>

2.

3. void *malloc(size_t size);

size是需要動態申請的內存的字節數。若申請成功,函數返回申請到的內存的起始地址,若申請失敗,返回NULL。我們看下面這個例子:

[cpp] view plain copy

1. int *get_memory(int n)

2. {

3.     int *p;

4.     p = (int *)malloc(sizeof(int));

5.     if(p == NULL)

6.     {

7.         printf(“malloc error\n”);

8.         return p;

9.     }

10.

11.     memset(p,0,n*sizeof(int));

12. }

使用該函數時,有下面幾點要注意:

1)只關心申請內存的大小;

2)申請的是一塊連續的內存。記得一定要寫出錯判斷;3)顯示初始化。即我們不知這塊內存中有什麼東西,要對其清零;

1.2 free函數

在堆上分配的額內存,需要用free函數顯示釋放,函數原型如下:

[cpp] view plain copy

#include <stdlib.h>  </stdlib.h>

void free(void *ptr);

使用free(),也有下面幾點要注意:

1)必須提供內存的起始地址;

調用該函數時,必須提供內存的起始地址,不能夠提供部分地址,釋放內存中的一部分是不允許的。

2)malloc和free配對使用;

編譯器不負責動態內存的釋放,需要程序員顯示釋放。因此,malloc與free是配對使用的,避免內存泄漏。

[cpp] view plain copy

free§;

p = NULL;

p = NULL是必須的,因爲雖然這塊內存被釋放了,但是p仍指向這塊內存,避免下次對p的誤操作;

3)不允許重複釋放

因爲這塊內存被釋放後,可能已另分配,這塊區域被別人佔用,如果再次釋放,會造成數據丟失;

2、我們經常將堆和棧相比較:

2.1申請方式

stack:  由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中爲b開闢空間

heap:  需要程序員自己申請,並指明大小,在c中malloc函數 ,如p1 = (char *)malloc(10);    2.2  申請後系統的響應

棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,否則將報異常提示棧溢出。

堆:首先應該知道操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多餘的那部分重新放入空閒鏈表中。

2.3申請大小的限制

棧:棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。

堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閒內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。

2.4申請效率的比較:

棧由系統自動分配,速度較快。但程序員是無法控制的。

堆是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便。

2.5堆和棧中的存儲內容

棧: 在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的地址,然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然後是函數中的局部變量。注意靜態變量是不入棧的。  當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。

堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容由程序員安排。

2.6存取效率的比較

char s1[] = “aaaaaaaaaaaaaaa”;  char *s2 = “bbbbbbbbbbbbbbbbb”;  aaaaaaaaaaa是在運行時刻賦值的;  而bbbbbbbbbbb是在編譯時就確定的;  但是,在以後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。

比如:

[cpp] view plain copy

1. #include

2. void main()

3. {

4. char a = 1;

5. char c[] = “1234567890”;

6. char *p =“1234567890”;

7. a = c[1];

8. a = p[1];

9. return;

10. }

對應的彙編代碼

[cpp] view plain copy

1. 0: a = c[1];

2. 00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

3. 0040106A 88 4D FC mov byte ptr [ebp-4],cl

4. 11: a = p[1];

5. 0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

6. 00401070 8A 42 01 mov al,byte ptr [edx+1]

7. 00401073 88 45 FC mov byte ptr [ebp-4],al

第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,再根據edx讀取字符,顯然慢了。

總結

堆和棧的區別可以用如下的比喻來看出:

棧就象我們去飯館裏喫飯,只管點菜(發出申請)、付錢、和喫(使用),喫飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。

堆就象是自己動手做喜歡喫的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。

其實做爲一個學習者,有一個學習的氛圍跟一個交流圈子特別重要這裏我推薦一個C/C++基礎交流583650410,不管你是小白還是轉行人士歡迎入駐,大家一起交流成長。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章