【轉】判斷棧和堆的生長方向

本文轉自cnblogs,原文鏈接判斷棧和堆的生長方向,重新排版並修改了一些小錯誤:)。

如何判斷棧的增長方向?


對於一個用慣了i386系列機器的人來說,這似乎是一個無聊的問題,因爲棧就是從高地址向低地址增長。不過,顯然這不是這個問題的目的,既然把這個問題拿出來,問的就不只是i386系列的機器,跨硬件平臺是這個問題的首先要考慮到的因素。

在一個物質極大豐富的年代,除非無路可退,否則我們堅決不會使用匯編去解決問題,而對於這種有系統編程味道的問題,C是一個不錯的選擇。那接下來的問題就是如何用C去解決這個問題。

C在哪裏會用到棧呢?稍微瞭解一點C的人都會立刻給出答案,沒錯,函數。我們知道,局部變量都存在於棧之中。似乎這個問題立刻就得到了解答,用一個函數聲明兩個局部變量,然後比較兩個變量的地址,這樣就可以得到答案。

等一下,怎麼比較兩個變量的地址呢?

先聲明的先入棧,所以,它的第一個變量的地址如果是高的,那就是從上向下增長。“先聲明的先入棧”?這個結論從何而來?一般編譯器都會這麼處理。要是不一般呢?這種看似正確的方法實際上是依賴於編譯器的,所以,可移植性受到了挑戰。

那就函數加個參數,比較參數和局部變量的位置,參數肯定先入棧。那爲什麼不能局部變量先入棧?第一反應是怎麼可能,但仔細想來又沒有什麼不可以。所以,這種方法也依賴於編譯器的實現。

那到底什麼纔不依賴於編譯器呢?

不妨回想一下,函數如何調用。執行一個函數時,這個函數的相關信息都會出現棧之中,比如參數、返回地址和局部變量。當它調用另一個函數時,在它棧信息保持不變的情況下,會把它調用那個函數的信息放到棧中。

似乎發現了什麼,沒錯,兩個函數的相關信息位置是固定的,肯定是先調用的函數其信息先入棧,後調用的函數其信息後入棧。那接下來,問題的答案就浮出了水面。

比如,設計兩個函數,一個作爲調用方,另一個作爲被調用方。被調用方以一個地址(也就是指針)作爲自己的入口參數,調用方傳入的地址是自己的一個局部變量的地址,然後,被調用方比較這個地址和自己的一個局部變量地址,由此確定棧的增長方向。

給出了一個解決方案之後,我們再回過頭來看看爲什麼之前的做法問題出在哪。爲什麼一個函數解決不了這個問題。前面這個大概解釋了函數調用的過程,我們提到,函數的相關信息會一起送入棧,這些信息就包括了參數、返回地址和局部變量等等,在計算機的術語裏,有個說法叫棧幀,指的就是這些與一次函數調用相關的東西,而在一個棧幀內的這些東西其相對順序是由編譯器決定的,所以,僅僅在一個棧幀內做比較,都會有對編譯器的依賴。就這個問題而言,參數和局部變量,甚至包括返回地址,都是相同的,因爲它們在同一個棧幀內,它們之間的比較是不能解決這個問題的,而它們就是一個函數的所有相關信息,所以,一個函數很難解決這個問題。

好了,既然有了這個瞭解,顯然可以擴展一下前面的解決方案,可以兩個棧幀內任意的東西進行比較,比如,各自的入口參數,都可以確定棧的增長方向。

狂想一下,會不會有編譯器每次專門留下些什麼,等下一個函數的棧幀入棧之後,在把這個留下的東西入棧呢?這倒是個破壞的好方法。如果哪位知道有這麼神奇的編譯器,不妨告訴我。我們可以把它的作者拉過來打一頓,想折磨死誰啊!

#include<stdio.h>

void func1();
void func2(int *a);

void func1()
{
    int a=0;
    func2(&a);
}
void func2(int *a)
{
    int b=0;
    printf("%x\n%x\n",a,&b);
}


int main()
{
    func1();
}

結果:

29f6ac

29f5c8

請按任意鍵繼續…

可以看到,a>b;說明生長方向向上。電腦中棧的增長方向是由高地址向低地址方向增長的。


爲什麼棧向下增長?

“這個問題與虛擬地址空間的分配規則有關,每一個可執行C程序,從低地址到高地址依次是:text,data,bss,堆,棧,環境參數變量;其中堆和棧之間有很大的地址空間空閒着,在需要分配空間的時候,堆向上漲,棧往下漲。”

這樣設計可以使得堆和棧能夠充分利用空閒的地址空間。如果棧向上漲的話,我們就必須得指定棧和堆的一個嚴格分界線,但這個分界線怎麼確定呢?平均分?但是有的程序使用的堆空間比較多,而有的程序使用的棧空間比較多。所以就可能出現這種情況:一個程序因爲棧溢出而崩潰的時候,其實它還有大量閒置的堆空間呢,但是我們卻無法使用這些閒置的堆空間。所以呢,最好的辦法就是讓堆和棧一個向上漲,一個向下漲,這樣它們就可以最大程度地共用這塊剩餘的地址空間,達到利用率的最大化!!

呵呵,其實當你明白這個原理的時候,你也會不由地驚歎當時設計計算機的那些科學家驚人的聰明和智慧!!

(堆棧方向相反極小情況會發生的問題,堆棧重疊)。

爲什麼要把堆和棧分開?

爲什麼要把堆和棧區分出來呢?棧中不是也可以存儲數據嗎?

  第一,從軟件設計的角度看,棧代表了處理邏輯,而堆代表了數據。
這樣分開,使得處理邏輯更爲清晰。分而治之的思想。這種隔離、模塊化的思想在軟件設計的方方面面都有體現。

  第二,堆與棧的分離,使得堆中的內容可以被多個棧共享(也可以理解爲多個線程訪問同一個對象)。這種共享的收益是很多的。一方面這種共享提供了一種有效的數據交互方式(如:共享內存),另一方面,堆中的共享常量和緩存可以被所有棧訪問,節省了空間。

  第三,棧因爲運行時的需要,比如保存系統運行的上下文,需要進行地址段的劃分。由於棧只能向下增長,因此就會限制住棧存儲內容的能力。而堆不同,堆中的對象是可以根據需要動態增長的,因此棧和堆的拆分,使得動態增長成爲可能,相應棧中只需記錄堆中的一個地址即可。

  第四,面向對象就是堆和棧的完美結合。其實,面向對象方式的程序與以前結構化的程序在執行上沒有任何區別。但是,面向對象的引入,使得對待問題的思考方式發生了改變,而更接近於自然方式的思考。當我們把對象拆開,你會發現,對象的屬性其實就是數據,存放在堆中;而對象的行爲(方法),就是運行邏輯,放在棧中。我們在編寫對象的時候,其實即編寫了數據結構,也編寫的處理數據的邏輯。不得不承認,面向對象的設計,確實很美。


遞歸溢出原因:

1.遞歸層次太深。

2.人爲

   #include  
  int main ( ) 
  { 
      char name[8]; 
      printf("Please type your name: "); 
      gets(name); 
      printf("Hello, %s!", name); 
      return 0; 
  }

編譯並且執行,我們輸入ipxodi,就會輸出Hello,ipxodi!。程序運行中,堆棧是怎麼操作的呢?

  在main函數開始運行的時候,堆棧裏面將被依次放入返回地址,EBP。
  我們用gcc -S 來獲得彙編語言輸出,可以看到main函數的開頭部分對應如下語句:

pushl %ebp

movl %esp,%ebp

subl $8,%esp

  首先他把EBP保存下來,,然後EBP等於現在的ESP,這樣EBP就可以用來訪問本函數的局部變量。之後ESP減8,就是堆棧向上增長8個字節,用來存放name[]數組。最後,main返回,彈出ret裏的地址,賦值給EIP,CPU繼續執行EIP所指向的指令。

  現在我們再執行一次,輸入ipxodiAAAAAAAAAAAAAAA,執行完gets(name)之後,由於我們輸入的name字符串太長,name數組容納不下,只好向內存頂部繼續寫‘A’。由於堆棧的生長方向與內存的生長方向相反,這些‘A’覆蓋了堆棧的老的元素。 我們可以發現,EBP,ret都已經被‘A’覆蓋了。在main返回的時候,就會把‘AAAA’的ASCII碼:0x41414141作爲返回地址,CPU會試圖執行0x41414141處的指令,結果出現錯誤。這就是一次堆棧溢出。

3、如何利用堆棧溢出

  我們已經制造了一次堆棧溢出。其原理可以概括爲:由於字符串處理函數(gets,strcpy等等)沒有對數組越界加以監視和限制,我們利用字符數組寫越界,覆蓋堆棧中的老元素的值,就可以修改返回地址。(更多:http://security.ctocio.com.cn/tips/485/7723985.shtml)。

堆(heap)和棧(stack)有什麼區別??

簡單的可以理解爲:
heap:是由malloc之類函數分配的空間所在地。地址是由低向高增長的。
stack:是自動分配變量,以及函數調用的時候所使用的一些空間。地址是由高向低減少的。

預備知識—程序的內存分配

一個由c/C++編譯的程序佔用的內存分爲以下幾個部分

1、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。

2、堆區(heap) —
一般由程序員分配釋放,若程序員不釋放,程序結束時可能由OS回收。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表,呵呵。

3、全局區(靜態區)(static)—,全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域,未初始化的全局變量和未初始化的靜態變量在相鄰的另一塊區域。
- 程序結束後有系統釋放

4、文字常量區 —常量字符串就是放在這裏的。 程序結束後由系統釋放

5、程序代碼區—存放函數體的二進制代碼。

二、例子程序

這是一個前輩寫的,非常詳細

//main.cpp

int a = 0; 全局初始化區

char *p1; 全局未初始化區

main()

{

    int b; 棧

    char s[] = "abc"; 棧

    char *p2; 棧

    char *p3 = "123456"; 123456在常量區,p3在棧上。

    static int c =0; 全局(靜態)初始化區

    p1 = (char *)malloc(10);

    p2 = (char *)malloc(20);

    分配得來得10和20字節的區域就在堆區。

    strcpy(p1, "123456"); 123456放在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方。

}

二、堆和棧的理論知識

2.1申請方式

stack:
由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中爲b開闢空間
heap:
需要程序員自己申請,並指明大小,在c中malloc函數
如char p1 = (char )malloc(10);
在C++中用new運算符
如char *p2 = new char[10];
但是注意p1、p2本身是在棧中的。

2.2申請後系統的響應

棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,否則將報異常提示棧溢出。
堆:首先應該知道操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,

會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多餘的那部分重新放入空閒鏈表中。

2.3申請大小的限制

棧:在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。

堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閒內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。

2.4申請效率的比較:

棧由系統自動分配,速度較快。但程序員是無法控制的。

堆是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度, 也最靈活

2.5堆和棧中的存儲內容

棧: 在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的地址,然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然後是函數中的局部變量。注意靜態變量是不入棧的。

當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。

堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。

2.6存取效率的比較
char s1[] = “aaaaaaaaaaaaaaa”;
char *s2 = “bbbbbbbbbbbbbbbbb”;
aaaaaaaaaaa是在運行時刻賦值的;
而bbbbbbbbbbb是在編譯時就確定的;
但是,在以後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。
比如:

#include
void main()
{
    char a = 1;
    char c[] = "1234567890";
    char *p ="1234567890";
    a = c[1];
    a = p[1];
    return;
}

對應的彙編代碼

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指edx中,在根據edx讀取字符,顯然慢了。

2.7小結:

堆和棧的區別可以用如下的比喻來看出:

使用棧就象我們去飯館裏吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。

使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。

堆和棧的區別主要分:

操作系統方面的堆和棧,如上面說的那些,不多說了。

還有就是數據結構方面的堆和棧,這些都是不同的概念。這裏的堆實際上指的就是(滿足堆性質的)優先隊列的一種數據結構,第1個元素有最高的優先權;棧實際上就是滿足先進後出的性質的數學或數據結構。

雖然堆棧,堆棧的說法是連起來叫,但是他們還是有很大區別的,連着叫只是由於歷史的原因。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章