一.C語言程序的存儲區域
1.由C語言代碼(文本文件)形成可執行程序(二進制文件),需要經過編譯-彙編-連接三個階段。編譯過程把C語言文本文件生成彙編程序,彙編過程把彙編程序形成二進制機器代碼,連接過程則將各個源文件生成的二進制機器代碼文件組合成一個文件。
2.C語言編寫的程序經過編譯-連接後,將形成一個統一文件,它由幾個部分組成。在程序運行時又會產生其他幾個部分,各個部分代表了不同的存儲區域:
1>代碼段(Code或Text)
代碼段由程序中執行的機器代碼組成。在C語言中,程序語句執行編譯後,形成機器代碼。在執行程序的過程中,CPU的程序計數器指向代碼段的每一條機器代碼,並由處理器依次運行。
2>只讀數據段(RO data)
只讀數據段是程序使用的一些不會被更改的數據,使用這些數據的方式類似查表式的操作,由於這些變量不需要更改,因此只需要放置在只讀存儲器中即可。
3>已初始化讀寫數據段(RW data)
已初始化數據是在程序中聲明,並且具有初值的變量,這些變量需要佔用存儲器的空間,在程序執行時它們需要位於可讀寫的內存區域內,並且有初值,以供程序運行時讀寫。
4>未初始化數據段(BBS)
未初始化數據是在程序中聲明,但是沒有初始化的變量,這些變量在程序運行之前不需要佔用存儲器的空間。
5>堆(heap)
堆內存只在程序運行時出現,一般由程序員分配和釋放。在具有操作系統的情況下,如果程序沒有釋放,操作系統可能在程序(例如一個進程)結束後會後內存。
6>棧(statck)
堆內存只在程序運行時出現,在函數內部使用的變量,函數的參數以及返回值將使用棧空間,棧空間由編譯器自動分配和釋放。
3.代碼段、只讀數據段、讀寫數據段、未初始化數據段屬於靜態區域,而堆和棧屬於動區域。代碼段、只讀數據段和讀寫數據段將在連接之後產生,未初始化數據段將在程序初始化的時候開闢,而對堆和棧將在程序餓運行中分配和釋放。
4.C語言程序分爲映像和運行時兩種狀態。在編譯-連接後形成的映像中,將只包含代碼段(Text)、只讀數據段(R0 Data)和讀寫數據段(RW Data)。在程序運行之前,將動態生成未初始化數據段(BSS),在程序的運行時還將動態生成堆(Heap)區域和棧(Stack)區域。
注:1.一般來說,在靜態的映像文件中,各個部分稱之爲節(Section),而在運行時的各個部分稱之爲段(Segment)。如果不詳細區分,統稱爲段。
2.C語言在編譯連接後,將生成代碼段(TEXT),只讀數據段(RO Data)和讀寫數據段(RW Data)。在運行時,除了上述三個區域外,還包括未初始化數據段(BBS)區域和堆(heap)區域和棧(Stack)區域。
二.C語言程序的段
1.段的分類
每一個源程序生成的目標代碼將包含源程序所需要表達的所有信息和功能。目標代碼中各段生成情況如下:
1>代碼段(Code)
代碼段由程序中的各個函數產生,函數的每一個語句將最終經過編譯和彙編生成二進制機器代碼
2>只讀數據段(RO Data)
只讀數據段由程序中所使用的數據產生,該部分數據的特點在運行中不需要改變,因此編譯器會將數據放入只讀的部分中。C語言的一些語法將生成只讀數據數據段。
2 只讀數據段(RO Data)
只讀數據段(RO Data)由程序中所使用的數據產生,該部分數據的特點是在運行中不需要改變,因此編譯器會將數據放入只讀的部分中。以下情況將生成只讀數據段。
n 只讀全局變量
定義全局變量const char a[100]=”abcdefg”將生成大小爲100個字節的只讀數據區,並使用字符串“abcdefg”初始化。如果定義爲const char a[]=”abcdefg”,沒有指定大小,將根據“abcdefgh”字串的長度,生成8個字節的只讀數據段。
n 只讀局部變量
例如:在函數內部定義的變量const char b[100]=”9876543210”;其初始化的過程和全局變量。
n 程序中使用的常量
例如:在程序中使用printf("information\n”),其中包含了字串常量,編譯器會自動把常量“information \n”放入只讀數據區。
注:在const char a[100]={“ABCDEFG”}中,定義了100個字節的數據區,但是隻初始化了前面的8個字節(7個字符和表示結束符的‘\0’)。在這種用法中,實際後面的字節米有初始化,但是在程序中也不能寫,實際上沒有任何用處。因此,在只讀數據段中,一般都需要做完全的的初始化。
3.讀寫數據段(RW Data)
讀寫數據段表示了在目標文件中一部分可以讀也可以寫的數據區,在某些場合它們又被稱爲已初始化數據段。這部分數據段和代碼,與只讀數據段一樣都屬於程序中的靜態區域,但是具有科協的特點。
n 已初始化全局變量
例如:在函數外部,定義全局的變量char a[100]=”abcdefg”
n 已初始化局部靜態變量
例如:在函數中定義static char b[100]=”9876543210”。函數中由static定義並且已經初始化的數據和數組將被編譯爲讀寫數據段。
說明:
讀寫數據區的特點是必須在程序中經過初始化,如果只有定義,沒有初始值,則不會生成讀寫數據區,而會定義爲未初始化數據區(BSS)。如果全局變量(函數外部定義的變量)加入static修飾符,寫成static char a[100]的形式,這表示只能在文件內部使用,而不能被其他文件使用。
4.未初始化數據段(BSS)
未初始化數據段常被稱之爲BSS(英文名爲Block start by symbol的縮寫)。與讀寫數據段類似,它也屬於靜態數據區。但是該段中數據沒有經過初始化。因此它只會在目標文件中被標識,而不會真正稱爲目標文件中的一個段,該段將會在運行時產生。未初始化數據段只有在運行的初始化階段纔會產生,因此它的大小不會影響目標文件的大小。
三.在C語言的程序中,對變量的使用還有以下注意
1.在函數體中定義的變量通常是在棧上,不需要在程序中進行管理,由編譯器處理。
2.用malloc,realoc等分配分配內存的函數所分配的內存空間在堆上,程序必須保證在使用後使用後freee釋放,否則會發生內存泄漏。
3.所有函數體外定義的是全局變量,加了static修飾符後的變量不管在函數內部或者外部存放在全局區(靜態區)。
4.使用const定義的變量將放於程序的只讀數據區。
說明:
在C語言中,可以定義static變量:在函數體內定義的static變量只能在該函數體內有效;在所有函數體外定義的static變量,也只能在該文件中有效,不能在其他源文件中使用;對於沒有使用static修飾的全局變量,可以在其他的源文件中使用。這些區別是編譯的概念,即如果不按要求使用變量,編譯器會報錯。使用static 和沒使用static修飾的全局變量最終都將放置在程序的全局去(靜態去)。
四.程序中段的使用
C語言中的全局區(靜態區),實際上對應着下述幾個段:
只讀數據段:R0 Data
讀寫數據段:RW Data
未初始化數據段:BSS Data
一般來說,直接定義的全局變量在未初始化數據區,如果該變量有初始化則是在已初始化數據區(RW Data),加上const修飾符將放置在只讀區域(R0 Data).
eg:
const char ro[]=”this is a readonlydata”;//只讀數據段,不能改變ro數組中的內容,ro存放在只讀數據段。
char rw1[]=”this is global readwrite data”;//已初始化讀寫數據段,可以改變數組rw1中的內容。應爲數值是賦值不是把”this is global readwrite data” 地址給了rw1,不能改變”this is global readwrite data”的數值。因爲起是文字常量放在只讀數據段中
char bss_1[100];//未初始化數據段
const char *ptrconst = “constant data”;//”constant data”放在只讀數據段,不能改變ptrconst中的值,因爲其是地址賦值。ptrconst指向存放“constant data”的地址,其爲只讀數據段。但可以改變ptrconst地址的數值,因其存放在讀寫數據段中。
int main()
{
short b;//b放置在棧上,佔用2個字節
char a[100];//需要在棧上開闢100個字節,a的值是其首地址
chars[]=”abcde”;//s在棧上,佔用4個字節,“abcde”本身放置在只讀數據存儲區,佔6字節。s是一個地址常量,不能改變其地址數值,即s++是錯誤的。
char*p1;//p1在棧上,佔用4個字節
char*p2 =”123456”;//”123456”放置在只讀數據存儲區,佔7個字節。p2在棧上,p2指向的內容不能更改,但是p2的地址值可以改變,即p2++是對的。
static char bss_2[100];//局部未初始化數據段
static int c=0 ;//局部(靜態)初始化區
p1 = (char *)malloc(10*sizeof(char));//分配的內存區域在堆區
strcpy(p1,”xxx”);//”xxx”放置在只讀數據存儲區,佔5個字節
free(p1);//使用free釋放p1所指向的內存
return 0;
}
說明:
1.只讀數據段需要包括程序中定義的const型的數據(如:const char ro[]),還包括程序中需要使用的數據如“123456”。對於const char ro[]和const char * ptrconst的定義,它們指向的內存都位於只讀數據據區,其指向的內容都不允許修改。區別在於前者不允許在程序中修改ro的值,後者允許在程序中修改ptrconst本身的值。對於後者,改寫成以下的形式,將不允許在程序中修改ptrconst本身的值:
const char * const ptrconst = “const data”;
2.讀寫數據段包含了已經初始化的全局變量static char rw1[]以及局部靜態變量static char
rw2[]。rw1和rw2的差別在於編譯時,是在函數內部使用的還是可以在整個文件中使用。對於前者,static修飾在於控制程序的其他文件時候可以訪問rw1變量,如果有static修飾,將不能在其他的C語言源文件中使用rw1,這種影響針對編譯-連接的特性,但無論有static,變量rw1都將被放置在讀寫數據段。對於後者rw2,它是局部的靜態變量,放置在讀寫數據區;如果不使用static修飾,其意義將完全改變,它將會是開闢在棧空間局部變量,而不是靜態變量。
3.未初始化數據段,事例1中的bss_1[100]和bss_2[200]在程序中代表未初始化的數據段。其區別在於前者是全局的變量,在所有文件中都可以使用;後者是局部的變量,只在函數內部使用。未初始化數據段不設置後面的初始化數值,因此必須使用數值指定區域的大小,
編譯器將根據大小設置BBS中需要增加的長度。
4.棧空間包括函數中內部使用的變量如short b和char a[100],以及char *p1中p1這個變量的值。
1》變量p1指向的內存建立在堆空間上,堆空間只能在程序內部使用,但是堆空間(例如p1指向的內存)可以作爲返回值傳遞給其他函數處理。
2》棧空間主要用於以下3類數據的存儲:
a.函數內部的動態變量
b.函數的參數
c.函數的返回值
3》棧空間主要的用處是供函數內部的動態變量使用,變量的空間在函數開始之前開闢,在函數退出後由編譯器自動回收
4.看一個事例:
#include<stdio.h>
int main()
{
char*p =”tiger”;
p[1]=’I’;
p++;
printf(“%s\n”,p);
}
編譯後提示:段錯誤
分析:
char *p =”tiger”;系統在棧上開闢了4個字節存儲p的數值。”tiger”在只讀存儲區中存儲,因此”tiger”的內容不能改變,*p=”tiger”,表示地址賦值,因此,p指向了只讀存儲區,因此改變p指向的內容會引起段錯誤。但是因爲p是存放在棧上,因此p的數值是可以改變的,因此p++是正確的。
五.const的使用
1.前言:
const是一個C語言的關鍵字,它限定一個變量不允許被改變。使用const在一定程序上可以提高程序的健壯性,另外,在觀看別人代碼的時候,清晰理解const所起的作用,對理解被人的程序有所幫助。
2.const變量和 常量
(1)const修飾的變量,其值存放在只讀數據段中,起值不能被改變。稱爲只讀變量。
其形式爲 const int a=5;此處可以用a代替5.
(2)常量:其也存在只讀數據段中,其數值也不能被改變。其形式爲”abc”,5.
3.const 變量和const限定的內容
先看一個事例:
#include<stdio.h>
typedef char *pStr;
intmain()
{
char string[6] = “tiger”;
const char*p1 = string;
const pStr p2 = string;
p1++;
p2++;
printf(“p1=%s\np2=%s\n”,p1,p2);
}
程序經過編譯後,提示錯誤爲
error:increment of read-only variable ‘p2’
1>const 使用的基本形式爲:const char m;
限定m 不可變
2>替換1式中的m,const char *pm;
限定*pm不可變,當然pm是可變的,因此p1++是對的。
3>替換1式中的char,const newType m;
限定m不可變,問題中的pStr是一種新類型,因此問題中p2不可變,p2++是錯誤的。
(3)const 和指針
類型聲明中const用來修飾一個常量,有如下兩種寫法:
1>const在前面
const int nValue;//nValue是const
const char *pContent;//*pContent是const,pConst可變
const (char *)pContent;//pContent是const,*pContent可變
char *const pContent;//pContent是const,*pContent可變
const char * const pContent;//pContent和*pContent都是const
2>const 在後面與上面的聲明對等
int const nValue; // nValue是const
char const * pContent;//*pContent是const, pContent可變
(char *) constpContent;//pContent是const, *pContent可變
char* const pContent;// pContent是const, *pContent可變
char const* const pContent;//pContent和*pContent都是const
說明:const和指針一起使用是C語言中一個很常見的困惑之處,下面是兩天規則:
(1)沿着*號劃一條線,如果const位於*的左側,則const就是用來修飾指針所指向的變量,即指針指向爲常量;如果const位於*的右側,const就是修飾指針本身,即指針本身是常量。你可以根據這個規則來看上面聲明的實際意義,相信定會一目瞭然。
(2)對於const (char *) ; 因爲char *是一個整體,相當於一個類型(如char),因此,這是限定指針是const。
本篇文章來源於 Linux公社網站(www.linuxidc.com) 原文鏈接:http://www.linuxidc.com/Linux/2012-04/58050p5.htm