徹底瞭解指針

2004年7月31日星期六 第二次更新,增加了對象的堆內存分配,細化了指針數組和數組指針內存的說明 !

昨天給0405班輔導,當他們問我指針數組的問題的時候,由於好久沒用,感覺有些陌生了,所以今天歸納總結了一下,希望以後的朋友可以少走些彎路:)
一 :關於指針和堆的內存分配
先來介紹一下指針 : 指針一種類型,理論上來說它包含其他變量的地址,因此有的書上也叫它:地址變量。既然指針是一個類型,是類型就有大小,在達內的服務器上或者普通的 PC機上,都是4個字節大小,裏邊只是存儲了一個變量的地址而已。不管什麼類型的指針,char * ,int * ,int (*) ,string * ,float * ,都是說明了本指針所指向的地址空間是什麼類型而已,瞭解了這個基本上所有的問題都好象都變的合理了。

在C++中,申請和釋放堆中分配的存貯空間,分別使用new和delete的兩個運算符來完成:
指針類型 指針變量名=new 指針類型 (初始化);
        delete 指針名;
例如:1、 int *p=new int(0);
     它與下列代碼序列大體等價:
2、int tmp=0, *p=&tmp;
區別:p所指向的變量是由庫操作符new()分配的,位於內存的堆區中,並且該對象未命名。
  
下面是關於new 操作的說明 : 部分引自<<C++面向對象開發>>
1、new運算符返回的是一個指向所分配類型變量(對象)的指針。對所創建的變量或對象,都是通過該指針來間接操作的,而動態創建的對象本身沒有名字。
2、一般定義變量和對象時要用標識符命名,稱命名對象,而動態的稱無名對象(請注意與棧區中的臨時對象的區別,兩者完全不同:生命期不同,操作方法不同,臨時變量對程序員是透明的)。
3、堆區是不會在分配時做自動初始化的(包括清零),所以必須用初始化式(initializer)來顯式初始化。new表達式的操作序列如下:從堆區分配對象,然後用括號中的值初始化該對象。

下面是從堆中申請數組
1、申請數組空間:
指針變量名=new 類型名[下標表達式];
注意:“下標表達式”不是常量表達式,即它的值不必在編譯時確定,可以在運行時確定。這就是堆的一個非常顯著的特點,有的時候程序員本身都不知道要申請能夠多少內存的時候,堆就變的格外有用。
2、釋放數組空間:
delete [ ]指向該數組的指針變量名;
注意:方括號非常重要的,如果delete語句中少了方括號,因編譯器認爲該指針是指向數組第一個元素的,會產生回收不徹底的問題(只回收了第一個元素所 佔空間),我們通常叫它“內存泄露”,加了方括號後就轉化爲指向數組的指針,回收整個數組。delete [ ]的方括號中不需要填數組元素數,系統自知。即使寫了,編譯器也忽略。<<Think in c++>>上說過以前的delete []方括號中是必須添加個數的,後來由於很容易出錯,所以後來的版本就改進了這個缺陷。
下面是個例子,VC上編譯通過
#include<iostream>
using namespace std;
//#include <iostream.h>  //for VC
#include <string.h>
void main(){
int n;
char *p;
cout<<"請輸入動態數組的元素個數"<<endl;
cin>>n; //n在運行時確定,可輸入17
p=new char[n]; //申請17個字符(可裝8個漢字和一個結束符)的內存空間strcpy(pc,“堆內存的動態分配”);//
cout<<p<<endl;
delete []p;//釋放pc所指向的n個字符的內存空間return ; }

通過指針使堆空間,編程中的幾個可能問題

1.動態分配失敗。返回一個空指針(NULL),表示發生了異常,堆資源不足,分配失敗。
   data = new double [m]; //申請空間
if ((data ) == 0)…… //或者==NULL
2.指針刪除與堆空間釋放。刪除一個指針p(delete p;)實際意思是刪除了p所指的目標(變量或對象等),釋放了它所佔的堆空間,而不是刪除p本身,釋放堆空間後,p成了空懸指針,不能再通過p使用該空間,在重新給p賦值前,也不能再直接使用p。
3.內存泄漏(memory leak)和重複釋放。new與delete 是配對使用的, delete只能釋放堆空間。如果new返回的指針值丟失,則所分配的堆空間無法回收,稱內存泄漏,同一空間重複釋放也是危險的,因爲該空間可能已另分 配,而這個時候又去釋放的話,會導致一個很難查出來的運行時錯誤。所以必須妥善保存new返回的指針,以保證不發生內存泄漏,也必須保證不會重複釋放堆內 存空間。
4.動態分配的變量或對象的生命期。無名變量的生命期並不依賴於建立它的作用域,比如在函數中建立的動態對象在函數返回後仍可使用。我們也稱堆空間爲自由 空間(free store)就是這個原因。但必須記住釋放該對象所佔堆空間,並只能釋放一次,在函數內建立,而在函數外釋放是一件很容易失控的事,往往會出錯,所以永遠 不要在函數體內申請空間,讓調用者釋放,這是一個很差的做法。你再怎麼小心翼翼也可能會帶來錯誤。
類在堆中申請內存 :
通過new建立的對象要調用構造函數,通過deletee刪除對象要調用析構函數。
CGoods *pc;
pc=new CGoods;  //分配堆空間,並構造一個無名對象
                              //的CGoods對象;
…….
delete pc;  //先析構,然後將內存空間返回給堆;        堆對象的生命期並不依賴於建立它的作用域,所以除非程序結束,堆對象(無名對象)的生命期不會到期,並且需要顯式地用delete語句析構堆對象,上面 的堆對象在執行delete語句時,C++自動調用其析構函數。
正因爲構造函數可以有參數,所以new後面類(class)類型也可以有參數。這些參數即構造函數的參數。
但對創建數組,則無參數,並只調用缺省的構造函數。見下例類說明:

class CGoods{
          char Name[21];
          int  Amount;
          float Price;
          float Total_value;
public:
 CGoods(){}; //缺省構造函數。因已有其他構造函數,系統不會再自動生成缺省構造,必須顯式聲明。   CGoods(char* name,int amount ,float price){
           strcpy(Name,name);
           Amount=amount;
           Price=price;
           Total_value=price*amount;  }
           ……};//類聲明結束
下面是調用機制 :

void main(){
 int n;
 CGoods *pc,*pc1,*pc2;
 pc=new CGoods(“hello”,10,118000);
 //調用三參數構造函數   pc1=new CGoods();  //調用缺省構造函數  cout<<”輸入商品類數組元素數”<<endl;
 cin>>n;
 pc2=new CGoods[n];
//動態建立數組,不能初始化,調用n次缺省構造函數  
 ……
 delete pc;
 delete pc1;
 delete []pc2;  }

申請堆空間之後構造函數運行;
釋放堆空間之前析構函數運行;
再次強調:由堆區創建對象數組,只能調用缺省的構造函數,不能調用其他任何構造函數。如果沒有缺省的構造函數,則不能創建對象數組。

---------------------下面我們再來看一下指針數組和數組指針―――――――――――――
如果你想了解指針最好理解以下的公式 :
(1)int*ptr;//指針所指向的類型是int

  (2)char*ptr;//指針所指向的的類型是char

  (3)int**ptr;//指針所指向的的類型是int* (也就是一個int * 型指針)

  (4)int(*ptr)[3];//指針所指向的的類型是int()[3] //二維指針的聲明

(1)指針數組:一個數組裏存放的都是同一個類型的指針,通常我們把他叫做指針數組。
比如 int * a[10];它裏邊放了10個int * 型變量,由於它是一個數組,已經在棧區分配了10個(int * )的空間,也就是32位機上是40個byte,每個空間都可以存放一個int型變量的地址,這個時候你可以爲這個數組的每一個元素初始化,在,或者單獨做 個循環去初始化它。
例子:
int * a[2]={ new int(3),new int(4) };     //在棧區裏聲明一個int * 數組,它的每一個元素都在堆區裏申請了一個無名變量,並初始化他們爲3和4,注意此種聲明方式具有缺陷,VC下會報錯
例如 :
int * a[2]={new int[3],new int[3]};
delete a[0];
delet a[10];
但是我不建議達內的學生這麼寫,可能會造成歧義,不是好的風格,並且在VC中會報錯,應該寫成如下 :
int * a[2];
a[0]= new int[3];
a[1]=new int[3];
delete a[0];
delet a[10];
這樣申請內存的風格感覺比較符合大家的習慣;由於是數組,所以就不可以delete a;編譯會出警告.delete  a[1];
注意這裏 是一個數組,不能delete [] ;
( 2 ) 數組指針 : 一個指向一維或者多維數組的指針;
int * b=new int[10]; 指向一維數組的指針b ;
注意,這個時候釋放空間一定要delete [] ,否則會造成內存泄露, b 就成爲了空懸指針.

int (*b2)[10]=new int[10][10]; 注意,這裏的b2指向了一個二維int型數組的首地址.
注意:在這裏,b2等效於二維數組名,但沒有指出其邊界,即最高維的元素數量,但是它的最低維數的元素數量必須要指定!就像指向字符的指針,即等效一個字符串,不要把指向字符的指針說成指向字符串的指針。這與數組的嵌套定義相一致。
int(*b3) [30] [20];  //三級指針――>指向三維數組的指針;
int (*b2) [20];     //二級指針;
b3=new int [1] [20] [30];
b2=new int [30] [20];
      兩個數組都是由600個整數組成,前者是隻有一個元素的三維數組,每個元素爲30行20列的二維數組,而另一個是有30個元素的二維數組,每個元素爲20個元素的一維數組。
      刪除這兩個動態數組可用下式:
delete [] b3;  //刪除(釋放)三維數組;
delete [] b2;  //刪除(釋放)二維數組;
再次重申:這裏的b2的類型是int (*) ,這樣表示一個指向二維數組的指針。
b3表示一個指向(指向二維數組的指針)的指針,也就是三級指針.

( 3 ) 二級指針的指針
看下例 :
int (**p)[2]=new (int(*)[3])[2];
       p[0]=new int[2][2];
       p[1]=new int[2][2];
       p[2]=new int[2][2];
       delete [] p[0];
       delete [] p[1];
       delete [] p[2];
       delete [] p;
注意此地方的指針類型爲int (*),碰到這種問題就把外邊的[2]先去掉,然後回頭先把int ** p=new int(*)[n]申請出來,然後再把外邊的[2]附加上去;
p代表了一個指向二級指針的指針,在它申請空間的時候要注意指針的類型,那就是int (*)代表二級指針,而int (**)顧名思義就是代表指向二級指針的指針了。既然是指針要在堆裏申請空間,那首先要定義它的範圍:(int(*)[n])[2],n 個這樣的二級指針,其中的每一個二級指針的最低維是2個元素.(因爲要確定一個二級指針的話,它的最低維數是必須指定的,上邊已經提到)。然後我們又分別 爲p[0],p[1],p[2]…在堆裏分配了空間,尤其要注意的是:在釋放內存的時候一定要爲p[0],p[1],p[2],單獨delete[] ,否則又會造成內存泄露,在delete[]p 的時候一定先delete p[0]; delete p[1],然後再把給p申請的空間釋放掉 delete [] p ……這樣會防止內存泄露。

(3)指針的指針;
int ** cc=new (int*)[10]; 聲明一個10個元素的數組,數組每個元素都是一個int *指針,每個元素還可以單獨申請空間,因爲cc的類型是int*型的指針,所以你要在堆裏申請的話就要用int *來申請;
看下邊的例子  (vc & GNU編譯器都已經通過);
       int ** a= new int * [2];     //申請兩個int * 型的空間
       a[1]=new int[3];        //爲a的第二個元素又申請了3個int 型空間,a[1]指向了此空間首地址處
       a[0]=new int[4];        ////爲a的第一個元素又申請了4個int 型空間,a[0] 指向了此空間的首地址處
       int * b;
       a[0][0]=0;
       a[0][1]=1;
       b=a[0];
  delete [] a[0]       //一定要先釋放a[0],a[1]的空間,否則會造成內存泄露.;
       delete [] a[1];
  delete [] a;
       b++;
       cout<<*b<<endl;       //隨機數
注意 :因爲a 是在堆裏申請的無名變量數組,所以在delete 的時候要用delete [] 來釋放內存,但是a的每一個元素又單獨申請了空間,所以在delete [] a之前要先delete [] 掉 a[0],a[1],否則又會造成內存泄露.
(4) 指針數組 :
   
我們再來看看第二種 :二維指針數組
int *(*c)[3]=new int *[3][2];
如果你對上邊的介紹的個種指針類型很熟悉的話,你一眼就能看出來c是個二級指針,只不過指向了一個二維int * 型的數組而已,也就是二維指針數組。
例子 :
 int *(*b)[10]=new int*[2][10];//
b[0][0]=new int[100];
b[0][1]=new int[100];
*b[0][0]=1;
cout <<*b[0][0]<<endl;    //打印結果爲1
delete [] b[0][0];
delete [] b[0][1];
delete [] b;
cout<<*b[0][0]<<endl;    //打印隨機數
 這裏只爲大家還是要注意內存泄露的問題,在這裏就不再多說了。
如果看了上邊的文章,大家估計就會很熟悉,這個b是一個二維指針,它指向了一個指針數組

第二種 :
int **d[2];表示一個擁有兩個元素數組,每一個元素都是int ** 型,這個指向指針的指針:)
   d不管怎樣變終究也是個數組,呵呵,
   如果你讀懂了上邊的,那下邊的聲明就很簡單了:
   d[0]=new int *[10];
   d[1]=new int * [10];
delete [] d[0];
delete [] d[1];
具體的就不再多說了 :)
二 : 函數指針 

關於函數指針,我想在我們可能需要寫個函數,這個函數體內要調用另一個函數,可是由於項目的進度有限,我們不知道要調用什麼樣的函數,這個時候可能就需要一個函數指針;

int a();這個一個函數的聲明;
ing (*b)();這是一個函數指針的聲明;
讓我們來分析一下,左邊圓括弧中的星號是函數指針聲明的關鍵。另外兩個元素是函數的返回類型(void)和由邊圓括弧中的入口參數(本例中參數是空)。注 意本例中還沒有創建指針變量-只是聲明瞭變量類型。目前可以用這個變量類型來創建類型定義名及用sizeof表達式獲得函數指針的大小:
unsigned psize = sizeof (int (*) ()); 獲得函數指針的大小
// 爲函數指針聲明類型定義
typedef int (*PFUNC) ();

PFUNC是一個函數指針,它指向的函數沒有輸入參數,返回int。使用這個類型定義名可以隱藏複雜的函數指針語法,就我本人強烈建議我們大內弟子使用這種方式來定義;

下面是一個例子,一個簡單函數指針的回調(在GNU編譯器上通過,在VC上需要改變一個頭文件就OK了)

#include<iostream>              //GNU 編譯器 g++ 實現
using namespace std;
/*                              //vc 的實現
#include "stdafx.h"
#include <iostream.h>
*/

#define DF(F) int F(){  cout<<"this is in function "<<#F<<endl;/
      return 0;       /
}
//聲明定義DF(F)替代 int F();函數;
DF(a); DF(b); DF(c); DF(d); DF(e); DF(f); DF(g); DF(h); DF(i);     //聲明定義函數 a b c d e f g h i

// int (*pfunc)();              //一個簡單函數指針的聲明
typedef int(*FUNC)();   //一個函數指針類型的聲明

FUNC ff[] = {a,b,c,d,e,f,g,h,i};   //聲明一個函數指針數組,並初始化爲以上聲明的a,b,c,d,e,f,g,h,i函數

FUNC func3(FUNC vv){    //定義函數func3,傳入一個函數指針,並且返回一個同樣類型的函數指針
      vv();
      return vv;
}

/*FUNC func4(int (*vv)()){      //func3的另一種實現
      vv();
      return vv;
}*/

int main(){
      for(int i=0;i<sizeof(ff)/sizeof (FUNC);i++){  //循環調用函數指針
              FUNC r=func3(ff[ i ]);
              cout<<r()<<endl;                //輸出返回值,只是返回了0
      }
      return 0;
}
到目前爲止,我們只討論了函數指針及回調而沒有去注意ANSI C/C++的編譯器規範。許多編譯器有幾種調用規範。如在Visual C++中,可以在函數類型前加_cdecl,_stdcall或者_pascal來表示其調用規範(默認爲_cdecl)。C++ Builder也支持_fastcall調用規範。調用規範影響編譯器產生的給定函數名,參數傳遞的順序(從右到左或從左到右),堆棧清理責任(調用者或 者被調用者)以及參數傳遞機制(堆棧,CPU寄存器等)。
好了,先到此爲止吧,寫這篇文章耗費了基本上快半天的時間了,很多事情還沒有做,等改天有時間再回來整理,所有的源程序都放在openlab3服務器上我 的目錄下lib/cpp下,大家可以去拿。不知道的登陸openlab3 然後cd ~chengx/lib/cpp就可以看到了。

還有很複雜的聲明可能也是一種挑戰 比如<<Think in c++>>裏的
int (*(*f4())[10]();的聲明,f4是一個返回指針的函數,該指針指向了含有10個函數指針的數組,這些函數返回整形值;不是這個函數有特別之處,而是Bruce Eckel 說的“從右到左的辨認規則”是一種很好的方法,值得我們去學習,感謝他:)

最後我想應該跟大家說一下,寫程序應該就象JERRY所說的:簡單就是美;我們應該遵循一個原則 : KISS (Keep It Simple,Stupid ,儘量保持程序簡單 出自 :《Practical C programming》),把自己的程序儘量的簡單明瞭,這是個非常非常好的習慣。

由於寫的匆忙,可能其中有遺漏的地方,大家發現希望能指正:)
GOOD LUCK ! 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章