使用::std::vector作爲管理動態數組的優先選擇（轉載）

作者：wangtianxing

提交者：eastvc 發佈日期：2003-9-19 17:34:41
原文出處：http://www.cpphelp.net/issue/vector.html

摘要: 本文介紹了C++標準庫中的容器類vector，分析了它的優點，並且建議在應用程序中使用它作爲動態數組的優先選擇，而不是MFC的CArray<>等其他類模板。最後介紹了vector的接口和使用時的注意事項。

在一些使用 MFC 的程序中，經常看到許多程序使用 CArray<>，由於 CArray<>的設計問題，造成使用它的代碼的複雜化，增加了維護難度。因此建議使用 ::std::vector<> 代替 CArray<>。

另外，也看到一些程序在用 malloc/realloc/free/new[]/delete[] 等手工管理內存。在應用程序中，手工管理內存是容易導致錯誤的，應該用 ::std::vector<> 之類的對象來管理動態數組。

由於 MSDN 中關於 ::std::vector 的內容較少，我們在這裏做一些介紹，供參考。

不熟悉 CArray<>/WIN32 也沒關係，這裏提到它們的地方並不太多。

1. CArray<> VS ::std::vector<> ?

CArray<> 和 ::std::vector<> 一樣，都是模板類，用於管理任意類型的對象的動態數組。都在解構時釋放所管理的動態內存。因此都可以用於代替手工動態數組管理。

但是，CArray<> 是在 C++ 標準化之前很多年(VC++2.0時代)設計的，當時對 C++程序設計，面向對象程序設計，模板程序設計等技術認識嚴重不足，尤其是當時對面向對象技術的錯誤信仰與宣傳，造成 CArray<> 的設計有重大錯誤。

在 C++ 語言標準化以後(1998)，以及 VC++ 6.0 出世以後，提供了標準的::std::vector<> 模板，基本上在任何方面都要優於 CArray<>。Microsoft 由於要支持老的程序，因此一直保留了 CArray<>，但顯然並沒有打算按照新的思想去發展它(至少應該提供operator=(CArray const&)吧)。

概括起來，CArray<> 與 ::std::vector<> 有以下不同：

1) CArray<> 是 MFC 中的，::std::vector<> 存在於任何標準的 C++ 實現中。因此，你用熟了 CArray<> 也只能在 MFC 中用，若用熟了 ::std::vector<>，你可以在任何平臺的任何 C++ 編譯器下使用。使用標準的部件也有利於別人理解你的程序。 . CArray<> 繼承了 CObject，僅僅爲了實現 serialization，這是不恰當的，違反了 "You don't pay for what you don't use." 的 C++ 設計原則。::std::vector<> 沒有繼承任何東西，只是實現了管理一個動態數組該做的事。

2) CArray<> 不是一個恰當的值類型，例如下列操作都是不合法的：

CArray<int,int> a;
CArray<int,int> b(a);  // error, must use Copy().
b = a;        // error, must use Copy().
b == a;       // error, you must write your own.
b < a;        // error, you must write your own.

與 CArray<> 相反，::std::vector<> 是一個認真設計的值類型，天生是可以拷貝構造和可賦值的。如果 T 是可比較的，那麼 ::std::vector<T> 將自動地是可以比較的。

此外，由於涉及到四個特殊成員函數；

T(); // 缺省構造函數(default constructor)
~T(); // 解構函數(destructor)
T( T const& ); // 拷貝構造函數
T& operator=( T const& ); // 拷貝賦值函數

的自動生成，如果使用 CArray() 作爲 T 的成員變量，那麼上述的四個特殊函數中的後兩個將無法自動生成，需要手工寫：

 struct T
{
   T() {}
   T( T const& t )
   {
       a_.Copy( t.a_ );
       i_ = t.i_;
       d_ = t.d_;
       s_ = t.s_;
   }
   T& operator = ( T const& t )
   {
       if( this != &t )
       {
           a_.Copy( t.a_ );
           i_ = t.i_;
           d_ = t.d_;
           s_ = t.s_;
       }
       return *this;
   }
private:
   CArray<int,int> a_;
   int i_;
   double d_;
   ::std::string s_;
};

如果使用 ::std::vector<>：

struct T
{
private:
   ::std::vector<int> a_;
   int i_;
   double d_;
   ::std::string s_;
};

上面列出的三個特殊成員函數都不需要寫。好處是明顯的：當你增減 T 的成員變量時，你不必到
T(T const&) 和 operator=() 中去相應地增減。

3) 沒有現成的算法可以對 CArray<> 進行操作，而標準 C++ 裏的標準算法大多都可以直接在
::std::vector<> 上運行。例如：

static int const init_vals[] = { 3, 1, 4, 1, 6, 9 };
vector<int> a( init_vals, init_vals + 6 );
*find( a.begin(), a.end(), 6 ) = 5;    // 把6改成5
sort( a.begin(), a.end() );    // 排序。

可以說，CArray<> 的主要設計錯誤是把一個本來應該是一個簡單的“值”類型的東西設計成一個難用的“對象”類型了。所有的“值”的好特性都喪失了，但那些從CArray<>繼承的派生類呢？

CByteArray等的問題與 CArray<> 的問題一樣，甚至更多(例如，CPtrArray，永遠不要用)。

同樣，其他的 MFC container 模板，象 CMap<>, CList<> 等，都有類似問題，都應該用
::std::map<>，::std::list<> 等設計更好的東西代替。

2. ::std::vector<> 在哪裏?

::std::vector<> 在頭文件 <vector> 中定義:

(注意，標準的 C++ 頭文件都沒有 .h 後綴，有 .h 的文件是與 C 兼容的，或支持老的不標準的東西，象 <iostream.h>。)

namespace std 
{
    template<typename T, typename A = allocator<T> >
    struct vector
    {
        // 具體內容稍後討論
    };


    template<typename T, typename A>
        bool operator == ( vector<T,A> const& a, vector<T,A> const&    b );
    template<typename T, typename A>
        bool operator != ( vector<T,A> const& a, vector<T,A> const&    b );
    template<typename T, typename A>
        bool operator < ( vector<T,A> const& a, vector<T,A> const&    b );
    template<typename T, typename A>
        bool operator >= ( vector<T,A> const& a, vector<T,A> const&    b );
    template<typename T, typename A>
        bool operator > ( vector<T,A> const& a, vector<T,A> const&    b );
    template<typename T, typename A>
        bool operator >= ( vector<T,A> const& a, vector<T,A> const&    b );
}

vector<> 定義在 namespace std 中，使用時爲了減少擊鍵次數，通常使用一個類型定義縮短類型名稱：

#include <vector>
typedef ::std::vector<int> IntVector;
IntVector a;
IntVector b( a );
IntVector c;
c = b;
assert( a == c );

請注意 <vector> 中定義了六個 vector<T,A> 的比較函數。這些函數只在真的用到時纔會被實例化，纔會要求 T 也提供 operator==() 和 operator<()。

另外，A = alloctor<T>：用於提供一個用戶定義的存儲管理類。由於這個參數很少用到，而且在 VC++6 的實現中有問題，不能用，因此以下的討論忽略這一部分的內容。

3. ::std::vector<> 中的類型定義

vector<> 中定義了一些類型，下面只列出常用的：

typedef T value_type;
typedef T0 iterator;
typedef T1 const_iterator;
typedef T2 reverse_iterator;
typedef T3 const_reverse_iterator;

value_type 就是 vector<T> 的元素類型，也就是 T。當寫通用的算法處理任意類型的 vector<> 或其他容器類型時是很有用的。

iterator/const_iterator 是兩個 vector<> 的實現定義的未知類型，用於訪問vector<> 中的元素，類似於 T*/T const* 指針，他們的區別是一個指向的元素可被修改，另一個只可以讀：

typedef ::std::vector<int> IntVector;
IntVector::iterator iter;
IntVector::const_iterator c_iter;
// ...
++iter; iter++; // ok: increment, post-increment.
--iter; iter--; // ok: decrement, post-decrement.
++c_iter; c_iter++; // ok: increment, post-increment.
--c_iter; c_iter--; // ok: decrement, post-decrement.
*iter = 123; // ok.
int k = *iter; // ok.
k = *--c_iter; // ok.
*c_iter = k; // error.
c_iter = iter; // ok: iterator is convertible to const_iterator.
iter = c_iter; // error: can't convert const_iterator to iterator.

在使用上 iterator/const_iterator 和 T*/T const* 基本相同，事實上有些vector<> 的實現裏就是用 T*/T const* 實現 iterator/const_iterator 的，但又不可以把 iterator/const_iterator 當作真正的 T*/T const*：

T* p = iter; // may fail to compile.
T const* q = c_iter; // may fail to compile.

reverse_iterator/const_reverse_iterator 與 iterator/const_iterator 類似，但以相反的次序(從尾至頭)訪問 vector 中的元素。

各種各樣的 iterator 在 STL 中有特別重要的意義，但這裏我們不做具體介紹。只要理解通過 iterator 可以訪問 vector 中的元素，大概相當於一個指示位置的指針就行了。

4. ::std::vector<> 的構造

vector<> 提供了以下構造函數：(忽略 allocator 參數)

vector();
vector( size_t n, T const t=T() );
vector( vector const & );
vector( const_iterator first, const_iterator last );

1) vector();

構造一個空的 vector，不包含任何元素。

IntVector v1; // 空的整數向量。

2) vector( size_t n, T const t=T() );

構造一個 n 個相同元素 t 組成的 vector。如果不給出 t，那麼將用 T() 做缺省值:

IntVector v2( 100, 1234 ); // 100 個 1234.
IntVector v3( 100 ); // 100 個 0。

3) vector( vector const& other );

複製構造函數，複製 other 中的內容：

IntVector v4( v2 ); // 100 個 1234。

4) vector( const_iterator first, const_iterator last );

事實上，這個構造函數應該爲

template<typename Iter>
    vector( Iter first, Iter last );

即拷貝任意的序列 [first,last) 到 vector 中。由於 VC++6sp0 編譯程序的限制， Iter 被換爲 const_iterator 了。不過，碰巧 const_iterator就是 T const*，所以可以如下使用：

int a[] = { 1, 2, 3, 4, 5 };
IntVector v5( a, a + 5 ); // {1,2,3,4,5}
IntVector v6( v5.begin() + 2, v5.end() ); // {3,4,5}

5. 訪問 vector<> 中的元素

以下成員函數/運算符用於訪問 vector 中的一個元素:

T& at( size_t n );
T const& at( size_t n ) const;
T& operator [] ( size_t n );
T const& operator [] ( size_t n ) const;
T& front();
T const& front() const;
T& back();
T const& back() const;

請注意，由於 vector 是一個“值”語義的對象，所有的操作函數都必須嚴格保證 const 的正確性。所以，所有的元素訪問方法都有 const 和非 const兩個版本。

at(n) 和 operator [] (n) 都返回下標爲 n 的元素的引用，他們的區別是，at() 進行下標越界檢查，若發現越界，拋出 range_error 異常，operator[]不進行下標檢查。

front() 返回下標爲 0 的元素的引用，back() 返回最後一個元素的引用。

int a[] = { 4, 1, 4, 1, 5, 8 };
IntVector v( a, a + 6 );
// 使用 front(), back():
v.front() = 3;
v.back() = 9;
// 使用 operator [] ():
for( size_t i = 0; i < v.size(); ++i )
::std::cout << v[i] << '/n';

6. ::std::vector<> 的存儲管理

以下成員函數用於存儲管理：

void reserve( size_t n );
size_t capacity() const;
void resize( size_t n, T t=T() );
void clear();
size_t size() const;
bool empty() const { return size() == 0; }
size_t max_size() const;

另外，push_back(), insert() 等也涉及到存儲管理，後面另行介紹。

1) max_size()

返回 vector<T> 理論上可以裝的最多 T 的個數。這只是一個理論上的數字，大概是 4GB/sizeof(T)，沒有多大實用價值。在程序中不要用。

2) size()

返回 vector<T> 中實際裝的 T 的個數。相當於 CArray<>::GetSize()。

3) empty()

如果 vector<T> 中沒有任何 T 對象，返回 true。也就是返回 size() == 0。

4) clear();

清除 vector<T> 中的所有 T 對象。執行後 empty() 返回 true。大致相當於 resize(0)，但不要求 T 可被缺省構造。相當於 CArray<>::RemoveAll()。

5) resize( size_t n, T t = T() );

將 vector 中的元素個數設置爲 n，n 可以大於 size() 也可以小於 size。如果 n 小於 size()，那麼 vector 中下標爲 n..size()-1 的元素都將被解構。如果 n > size()，那麼將在 vector 的後面新增加
n - size() 個相同的元素 t。在增大 vector 時，可能發生存儲再次分配。總之，調用resize( n, t ) 後，(size() == n) 成立。

請注意，如果調用 resize( n ) 不帶參數 t ，那麼 T 必須可以缺省構造。

6) reserve( size_t n );

事先分配至少可以保存 n 個 T 對象的空間。調用後 (capacity() >= n)成立。

7) capacity();

返回已經分配的存儲空間夠容納的 T 類型對象的個數。後續的增加元素操作(如 push_back(), insert())如果增加元素後 vector 中的總元素個數不超過 capacity()，那麼 vector 的實現保證不重新分配存儲空間。

vector 管理的動態存儲空間是連續的。執行操作

IntVector v(7, 1); // seven ones.
v.reserve( 12 );

後，v 的狀態可以用下圖表示:

 /--size()---/
|1|1|1|1|1|1|1|-|-|-|-|-|
 /--capacity()---------/

其中，1 是已經構造的 int 類型的對象，- 是可以構造一個 int 類型的對象，但還沒有構造的原始空間。再執行

v.push_back( 2 );
v.push_back( 3 );

後，v 的狀態可用下圖表示：

 /----size()-----/
|1|1|1|1|1|1|1|2|3|-|-|-|
 /----capacity()-------/

執行 resize( 11, 4 ); 後：

 /----size()---------/
|1|1|1|1|1|1|1|2|3|4|4|-|
 /----capacity()-------/

capacity() >= size() 總是成立的。對於下標爲 [size()..capacity()-1]的未構造對象的存儲空間，是不可以訪問的：

v[11] = 5; // undefined behavior - anything can happen.

7. 添加元素到 vector 中

下列操作添加元素到 vector 中，並可能引起存儲分配：

void push_back( T const& t );
void insert( iterator pos, T const& t=T() );
void insert( iterator pos, size_t n, T const& t );
template<typename Iter>
    void insert( iterator pos, Iter first, Iter last );

push_back() 是把一個元素添加到 vector 的末尾。insert() 是把一個 t，或 n 個 t，或從 first 開始到 last 結束的一個序列插入到 pos 指示的位置之前。

當插入元素後 size() 將會大於 capacity() 時，將引起自動存儲分配。vector 將會分配一個比需要的存儲區大若干倍(通常是1.5到2)的新的存儲區，把老的元素拷貝過去，同時完成添加或插入，然後釋放老的存儲區。

這就是說，vector 自動存儲分配的空間大小是指數式增長的，這可以保證多次添加元素到 vector 中時，平均用時是接近於常數的。

IntVector v;
   
// add 0, 1, ..., 99 to v:
for( int i = 0; i < 100; ++i )
v.push_back( i );
   
// append 9, 8, 7,..., 0 to the end:
int a[] = { 9, 8, 7, 6, 5, 4, 3, 2, 1, 0 };
v.insert( v.end(), a, a + 10 );

8. 刪除元素

下列成員函數完成元素刪除：

void erase( iterator );
void erase( iterator first, iterator last );
void pop_back();
void clear();

這些函數分別刪除一個，一串，最後一個，或全部元素。

IntVector v;
for( int i = 0; i < 100; ++i )
    v.push_back( i );
   
// 刪除 50, 51, ..., 89:
v.erase( v.begin() + 50, v.end() - 10 );
   
// 刪除 49, 48:
v.pop_back();
v.pop_back();
   
// 全部刪除：
v.clear();

注意，刪除操作不會引起存儲分配，因此 capacity() 不變。

9. 作爲序列訪問 vector 中的元素

序列(sequence)在 STL 中是一個非常重要的概念，所有的容器類型和算法都涉及到，而且所有的算法都是建立在“序列”這個概念之上的。

“序列”是一個線性結構，由一個指示其起始和一個指示結束的疊代子(iterator)來決定。如果 first 和 last 是某種類型的疊代子，那麼經常用[first, last) 來表示一個序列。注意，first 指向的元素是這個序列的一個元素，而 last 指示的是這個序列最後一個元素之後的位置，可能根本沒有元素可以訪問。這種半閉半開的區間表示是整個 C++ 標準中的約定，而且確實可以簡化程序。

疊代子是傳統的 C/C++ 中指針的抽象和進一步分類。在 C++ 中把 iterator劃分爲 input iterator, output iterator, forward iterator,bidirectional iterator, random access iterator 五類。其中的 randomaccess iterator 是最強的一類，即允許的操作最多。C++ 中的指針類型以及vector<>/deque<> 的 iterator/const_iterator/reverse_iterator/const_reverse_iterator 都滿足 random access iterator 的要求。

vector<> 中定義了以下函數用於獲取被控制(管理的)序列(動態數組)的各種疊代子：

iterator begin();
iterator end();
const_iterator begin() const;
const_iterator end() const;
reverse_iterator rbegin();
reverse_iterator rend();
const_reverse_iterator rbegin() const;
const_reverse_iterator rend() const;

這裏我們不討論疊代子的一般概念，只舉幾個 random access iterator 的例子：

int a[] = { 1, 2, 3, 4, 5, 6 };

[a, a + 6) 是一個隨機訪問序列，指示了 a[] 中的所有元素。這裏疊代子的類型爲 int*。

[a + 2, a + 4) 也是一個序列，指示了 a[] 中的 3, 4 兩個元素。疊代子的類型仍然是 int*。

IntVector v( 100, 1 ); // 100 個 1。

[v.begin(), v.end()) 是一個隨機訪問序列，指示了 v 中的所有元素，疊代子的類型是 IntVector::iterator。

[v.begin() + 10, v.end() - 20 ) 也是一個隨機訪問序列，指的是 v 中除了頭 10 個和尾 20 個元素外的其它元素。

[v.rbegin(), v.rend() ) 是一個隨機訪問序列，指的是 v 中的所有元素，但與 [v.begin(), v.end() ) 不同，這個序列是從尾到頭遍歷所有元素。

[v.rbegin() + 20, v.rend() - 10) 與 [v.begin() + 10, v.end() - 20 )指示的元素相同，但遍歷順序相反。

下圖是有十個元素的 vector 的 begin()/end()/rbegin()/end() 的示意：

begin() ----------> end()
  |                   |
  v                   v
 |0|1|2|3|4|5|6|7|8|9|
^                   ^
|                   |
rend() <---------- rbegin()
   
IntVector v;
for( int i = 0; i < 10; ++i )
v.push_back( i );
   
// print 0, 1, 2, ..., 9:
for( IntVector::iterator i = v.begin(); i != v.end(); ++i )
::std::cout << *i << '/n';
   
// print 9, 8, ..., 0:
for( IntVector::reverse_iterator i = v.rbegin(); i != v.rend(); ++i )
::std::cout << *i << '/n';

除了使用 begin()/end()/rbegin()/rend() 來遍歷 vector 中的元素外，由於 vector 管理的空間是連續的，因此可以直接取地址進行處理：

::std::vector<HANDLE> handles;
handles.push_back( handle1 );
handles.push_back( handle2 );


::WaitForMultipleObjects(handles.size(), &handles[0],TRUE, INFINITE);

這在與 C 庫函數接口時尤其有用。

10. 賦值和交換

vector<> 是可以賦值的，這也是一般的“值”類型必須提供的操作：

IntVector v( 100, 123 );
IntVector v1;
v1 = v;

vector 另外還提供了

template<typename Iter>
void assign( Iter first, Iter last );
void assign( size_t n, T const& t = T() );

用於賦值：

int a[] = { 1, 3, 5, 7 };
v.assign( a, a + 4 ); // v 將包含 1, 3, 5, 7.
v.assign( 100 ); // 100 個 0。

還有一個很重要的操作：

void swap( vector& v ) throw();

用於交換兩個同類型的 vector 的值。它的特點是快速(只需要交換內部的三個指針)，不產生異常。這在寫一些保證異常安全的程序時非常有用。

事實上，swap() 基本上已經被當作類似於 operator=() 的一個“值”類型應該提供的基本操作，::std::swap() 也應該爲用戶定義的類型進行特例化，調用相應的類的成員 swap() 函數：

struct MyVal
{
  // blah blah.
  void swap( MyVal& ) throw();
};
   
namespace std {
  template<>
    void swap( MyVal& a, MyVal& b )
    { a.swap( b ); }
}

關於 swap()，值得專文討論。這裏我們只指出，vector<T>::swap() 是快速的，不拋出異常的，很有價值。

11. 使用 vector 時的存儲管理策略

從前面的介紹中可以看到，vector 的自動存儲分配是指數式的增加存儲空間，而且永不縮小已經分配的空間。這在大多數情況下是合適的。如果應用程序事先知道要用到的元素個數，可以先調用 reserve() 來保留(分配)空間，這樣可以避免以後增加元素時不必要的重新分配和元素拷貝：

IntVector v;
v.reserve( 100 );
for( int i = 0; i < 100; ++i )
    v.push_back( i );

請注意，reserve() 和 resize() 是本質上完全不同的。reserve(n) 保留的是未使用而能夠使用的原始空間，而 resize(n) 是真的創建了 n 個對象:

IntVector v;
v.resize( 100 ); // v 已經包含 100 個 0.
for( int i = 0; i < 100; ++i )
    v[i] = i; // 可以賦值

有時候，一個 vector 可能增長到較多個元素，然後又減少到較少的元素個數，這時，可能希望縮小 vector 分配的空間以節約內存。CArray<> 中提供了 FreeExtra()，但 vector<> 並沒有提供相應的函數。這時必須進行復制：

IntVector(v).swap( v );

有一種看法認爲拷貝構造函數同時也複製了capacity()，而標準中並沒有很明確地指出這一點，因此更安全的方法是

IntVector(v.begin(),v.end()).swap(v);

如果一個 vector 中可能要存儲的元素個數較多(例如，超過100個)，而且事先無法確定其個數(因此無法調用 reserve())，那麼通常 vector 不是一個恰當的數據結構，應該考慮用 ::std::deque<>。與 vector<> 相比，deque<>不保證背後的存儲空間是連續的(因此象上面的WaitForMultipleObjects()中的應用不能用 deque<HANDLE> 代替)，但有較好的伸縮性，還可以在數組的前端用 push_front()/pop_front() 增減元素(hence its name, doubly endedqueue)。

距上次轉文章已經有一段時間了，也就是說這一段時間都沒在編程，哎。。現在又開始了，轉給自己有空的時候看看的。。

站內首發文章

Leasangle

發佈了9 篇原創文章 · 獲贊 3 · 訪問量 7萬+

私信關注

使用::std::vector作爲管理動態數組的優先選擇（轉載）

1. CArray<> VS ::std::vector<> ?

2. ::std::vector<> 在哪裏?

3. ::std::vector<> 中的類型定義

4. ::std::vector<> 的構造

5. 訪問 vector<> 中的元素

6. ::std::vector<> 的存儲管理

7. 添加元素到 vector 中

8. 刪除元素

9. 作爲序列訪問 vector 中的元素

10. 賦值和交換

11. 使用 vector 時的存儲管理策略

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

CPU各種體系結構

WinSock的使用

STL之vector的使用（轉載）

C99標準介紹（轉載）

Oracle DBMS_OUTPUT 用法例子（轉載）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結