[轉:http://hi.baidu.com/bcc222/blog/item/9f137981a85dcfdf9123d9b9.html]
關於 CArray類
我們在使用vc進行比較複雜的編程時,經常需要用到複雜的數組結構,並希望能實現動態管理。由於C++並不支持動態數組,MFC提供了一個CArray類來實現動態數組的功能。有效的使用CArray類,可以提高程序的效率。
MFC提供了一套模板庫,來實現一些比較常見的數據結構如Array,List,Map。CArray即爲其中的一個,用來實現動態數組的功能。
CArray是從CObject派生,有兩個模板參數,第一個參數就是CArray類數組元素的變量類型,後一個是函數調用時的參數類型。
我們有一個類 class Object,我們要定義一個Object的動態數組,那麼我們可以用以下兩種方法:
CArray<Object,Object> Var1; CArray<Object,Object&> Var2;
Var1與Var2哪一個的效率要高呢? Var2的效率要高。爲什麼呢?接下來我們對CArray的源代碼做一個剖析就清楚了。
先了解一下CArray中的成員變量及作用。
TYPE* m_pData; // 數據保存地址的指針 int m_nSize; // 用戶當前定義的數組的大小 int m_nMaxSize; // 當前實際分配的數組的大小 int m_nGrowBy; // 分配內存時增長的元素個數
首先來看它的構造函數,對成員變量進行了初始化。
CArray<TYPE, ARG_TYPE>::CArray() { m_pData = NULL; m_nSize = m_nMaxSize = m_nGrowBy = 0; }
SetSize成員函數是用來爲數組分配空間的,從這裏着手,看CArray是如何對數據進行管理的。SetSize的函數定義如下:
void SetSize( int nNewSize, int nGrowBy = -1 );
nNewSize 指定數組的大小
nGrowBy 如果需要增加數組大小時增加的元素的個數。
對SetSize的代碼,進行分析。(由於代碼太長,只列出部分重要部分)
void CArray<TYPE, ARG_TYPE>::SetSize(int nNewSize, int nGrowBy) { if (nNewSize == 0) { // 第一種情況 // 當nNewSize爲0時,需要將數組置爲空, // 如果數組本身即爲空,則不需做任何處理 // 如果數組本身已含有數據,則需要清除數組元素 if (m_pData != NULL) { //DestructElements 函數實現了對數組元素析構函數的調用 //不能使用delete m_pData 因爲我們必須要調用數組元素的析構函數 DestructElements<TYPE>(m_pData, m_nSize); //現在才能釋放內存 delete[] (BYTE*)m_pData; m_pData = NULL; } m_nSize = m_nMaxSize = 0; } else if (m_pData == NULL) { // 第二種情況 // 當m_pData==NULL時還沒有爲數組分配內存 //首先我們要爲數組分配內存,sizeof(TYPE)可以得到數組元素所需的字節數 //使用new 數組分配了內存。注意,沒有調用構造函數 m_pData = (TYPE*) new BYTE[nNewSize * sizeof(TYPE)]; //下面的函數調用數組元素的構造函數 ConstructElements<TYPE>(m_pData, nNewSize); //記錄下當前數組元素的個數 m_nSize = m_nMaxSize = nNewSize; } else if (nNewSize <= m_nMaxSize) { // 第三種情況 // 這種情況需要分配的元素個數比已經實際已經分配的元素個數要少 if (nNewSize > m_nSize) { // 需要增加元素的情況 // 與第二種情況的處理過程,既然元素空間已經分配, // 只要調用新增元素的構造函數就Ok ConstructElements<TYPE>(&m_pData[m_nSize], nNewSize-m_nSize); } else if (m_nSize > nNewSize) { // 現在是元素減少的情況,我們是否要重新分配內存呢? // No,這種做法不好,後面來討論。 // 下面代碼釋放多餘的元素,不是釋放內存,只是調用析構函數 DestructElements<TYPE>(&m_pData[nNewSize], m_nSize-nNewSize); } m_nSize = nNewSize; } else { //這是最糟糕的情況,因爲需要的元素大於m_nMaxSize, // 意味着需要重新分配內存才能解決問題 // 計算需要分配的數組元素的個數 int nNewMax; if (nNewSize < m_nMaxSize + nGrowBy) nNewMax = m_nMaxSize + nGrowBy; else nNewMax = nNewSize; // 重新分配一塊內存 TYPE* pNewData = (TYPE*) new BYTE[nNewMax * sizeof(TYPE)]; //實現將已有的數據複製到新的的內存空間 memcpy(pNewData, m_pData, m_nSize * sizeof(TYPE)); // 對新增的元素調用構造函數 ConstructElements<TYPE>(&pNewData[m_nSize], nNewSize-m_nSize); //釋放內存 delete[] (BYTE*)m_pData; //將數據保存 m_pData = pNewData; m_nSize = nNewSize; m_nMaxSize = nNewMax; } }
注意上面代碼中標註爲粗體的代碼,它們實現了對象的構造與析構。如果我們只爲對象分配內存,卻沒有調用構造與析構函數,會不會有問題呢?
如果只是使用c++的基本數據類型,如果int,long,那的確不會有什麼問題。如果使用的是一個類,比如下面的類:
class Object { public: Object(){ ID = 0; } ~Object(); protected: int ID; };
我們只爲Object類分配了空間,也能正常使用。但是,類的成員變量ID的值卻是不定的,因爲沒有初始化。如果是一個更復雜的組合類,在構造函數中做了許多工作,那可能就不能正常運行了。
同樣,刪除的數組元素時,也一定要調用它的析構函數。
我們來看下面的Preson類
class Preson { public: Preson() { name = new char[10]; } ~Preson() { delete []name; } char* name; int age; }
如果我沒調用構造函數,那麼對name操作肯定會出錯。我們調用了構造函數後,刪除元素時,如果不調用析構函數,那麼,name所指向的內存不能正確釋放,就會造成內存泄漏。
我們來看一下ConstructElements與DestructElements如何實現構造與析構函數的調用。
下面是ConstructElements函數的實現代碼
template<class TYPE> AFX_INLINE void AFXAPI ConstructElements(TYPE* pElements, int nCount) { // first do bit-wise zero initialization memset((void*)pElements, 0, nCount * sizeof(TYPE)); for (; nCount--; pElements++) ::new((void*)pElements) TYPE; }
ConstructElements是一個模板函數。對構造函數的調用是通過標爲黑體的代碼實現的。可能很多人不熟悉new 的這種用法,它可以實現指定的內存空間中構造類的實例,不會再分配新的內存空間。類的實例產生在已經分配的內存中,並且new操作會調用對象的構造函數。因爲vc中沒有辦法直接調用構造函數,而通過這種方法,巧妙的實現對構造函數的調用。
再來看DestructElements 函數的代碼
template<class TYPE> AFX_INLINE void AFXAPI DestructElements(TYPE* pElements, int nCount) { for (; nCount--; pElements++) pElements->~TYPE(); }
DestructElements函數同樣是一個模板函數,實現很簡單,直接調用類的析構函數即可。
如果定義一個CArray對象 CArray<Object,Object&> myObject ,對myObject就可象數組一樣,通過下標來訪問指定的數組元素。通過[]來訪問數組元素是如何實現的呢?其實只要重載運算符[]即可。
CArray[]有兩種實現,區別在於返回值不同。我們來看看代碼:
template<class TYPE, class ARG_TYPE> AFX_INLINE TYPE CArray<TYPE, ARG_TYPE>::operator[](int nIndex) const { return GetAt(nIndex); } template<class TYPE, class ARG_TYPE> AFX_INLINE TYPE& CArray<TYPE, ARG_TYPE>::operator[](int nIndex) { return ElementAt(nIndex); }
前一種情況是返回的對象的實例,後一種情況是返回對象的引用。分別調用不同的成員函數來實現。我們來比較一下這兩個函數的實現(省略部分):
TYPE GetAt(int nIndex) const { ASSERT(nIndex >= 0 && nIndex < m_nSize); return m_pData[nIndex]; } TYPE& ElementAt(int nIndex) { ASSERT(nIndex >= 0 && nIndex < m_nSize); return m_pData[nIndex]; }
除了返回值不同,其它都一樣,有什麼區別嗎?我們來看一個實例說明。
CArray<int,int&> arrInt; arrInt.SetSize(10); int n = arrInt.GetAt(0); int& l = arrInt.ElementAt(0); cout << arrInt[0] <<endl; n = 10; cout << arrInt[0] <<endl; l = 20; count << arrInt[0] << endl;
結果會發現,n的變化不會影響到數組,而l的變化會改變數組元素的值。實際即是對C++中引用運算符的運用。
CArray下標訪問是非安全的,它並沒有超標預警功能。雖然使用ASSERT提示,但下標超範圍時沒有進行處理,會引起非法內存訪問的錯誤。
前面談到模板實例化時有兩個參數,後一個參數一般用引用,爲什麼呢?看看Add成員函數就可以明。Add函數的作用是向數組添加一個元素。下面是它的定義:
int CArray<TYPE, ARG_TYPE>::Add(ARG_TYPE newElement)
Add函數使用的參數是模板參數的二個參數,也就是說,這個參數的類型是我們來決定的,可以使用Object或Object&的方式。熟悉C++的朋友都知道,傳引用的效率要高一些。如果是傳值的話,會在堆棧中再產生一個新的對象,需要花費更多的時間。
下面來分析一下Add函數的代碼:
template<class TYPE, class ARG_TYPE> AFX_INLINE int CArray<TYPE, ARG_TYPE>::Add(ARG_TYPE newElement) { int nIndex = m_nSize; SetAtGrow(nIndex, newElement); return nIndex; }
它實際是通過SetAtGrow函數來完成這個功能的,它的作用是設置指定元素的值。下面是SetAtGrow的代碼:
template<class TYPE, class ARG_TYPE> void CArray<TYPE, ARG_TYPE>::SetAtGrow(int nIndex, ARG_TYPE newElement) { if (nIndex >= m_nSize) SetSize(nIndex+1, -1); m_pData[nIndex] = newElement; }
SetAtGrow的實現也很簡單,如果指定的元素已經存在,就把改變指定元素的值。如果指定的元素不存在,也就是 nIndex>=m_nSize的情況,就調用SetSize來調整數組的大小。
其實,到這裏,大家對CArray類的內部實現有了一定的瞭解,只要看看MSDN的文檔,就可以靈活運用了。