C++標準庫類型——迭代器

C++標準庫類型——迭代器

基礎介紹

​ 迭代器提供對一個容器中的對象的訪問方法,並且定義了容器中對象的範圍。

​ 迭代器就如同一個指針。事實上,C++的指針也是一種迭代器。但是,迭代器不僅僅是指針,因此你不能認爲它們一定具有地址值。例如,一個數組索引,也可以認爲是一種迭代器。

​ 除了使用下標來訪問 vector 對象的元素外,標準庫還提供了另一種訪問元素的方法:使用迭代(iterator)

​ 迭代器是一種檢查容器內元素並遍歷元素的數據類型。

​ 標準庫爲每一種標準容器(包括vector)定義了一種迭代器類型。迭代器類型提供了比下標操作更通用化的方法:所有的標準庫容器都定義了相應的迭代器類型,而只有少數的容器支持下標操作。因爲迭代器對所有的容器都適用,現代 C++ 程序更傾向於使用迭代器而不是下標操作訪問容器元素,即使對支持下標操作的vector 類型也是這樣。

容器的iterator 類型

​ 每種容器類型都定義了自己的迭代器類型,如vector

 vector<int>::iterator iter;

​ 語句定義了一個名爲 iter 的變量,它的數據類型是 vector<int > 定義的 iterator 類型。每個標準庫容器類型都定義了一個名爲 iterator 的成員,這裏的 iterator 與迭代器實際類型的含義相同。

術語:迭代器和迭代器類型

​ 程序員首次遇到有關迭代器的術語時可能會困惑不解,原因之一是由於同一個術語 iterator 往往表示兩個不同的事物。一般意義上指的是迭代器的概念;而具體而言時指的則是由容器定義的具體的 iterator 類型,如 vector<int>

​ 重點要理解的是,有許多用作迭代器的類型,這些類型在概念上是相關的。若一種類型支持一組確定的操作(這些操作可用來遍歷容器內的元素,並訪問這些元素的值),我們就稱這種類型爲迭代器。

​ 各容器類都定義了自己的 iterator類型,用於訪問容器內的元素。換句話說,每個容器都定義了一個名爲 iterator 的類型,而這種類型支持(概念上的)迭代器的各種操作。

begin 和 end 操作

​ 每種容器都定義了一對命名爲 beginend 的函數,用於返回迭代器。如果容器中有元素的話,由 begin 返回的迭代器指向第一個元素:

 vector<int>::iterator iter =ivec.begin();

​ 上述語句把 iter 初始化爲由名爲 vector 操作返回的值。假設 vector 不空,初始化後,iter 即指該元素爲 ivec[0]

​ 由 end 操作返回的迭代器指向 vector 的“末端元素的下一個”。“超出末端迭代器”(off-the-enditerator)。表明它指向了一個不存在的元素。如果 vector 爲空,begin 返回的迭代器與 end 返回的迭代器相同。

​ 由 end 操作返回的迭代器並不指向 vector 中任何實際的元素,相反,它只是起一個哨兵(sentinel)的作用,表示我們已處理完 vector 中所有元素。

vector 迭代器的自增和解引用運算

​ 迭代器類型定義了一些操作來獲取迭代器所指向的元素,並允許程序員將迭代器從一個元素移動到另一個元素。

​ 迭代器類型可使用解引用操作符(dereference operator)(*)來訪問迭代器所指向的元素:

 *iter = 0;

​ 解引用操作符返回迭代器當前所指向的元素。假設 iter 指向 vector 對象ivec 的第一元素,那麼 *iterivec[0] 就是指向同一個元素。上面這個語句的效果就是把這個元素的值賦爲0。

​ 迭代器使用自增操作符向前移動迭代器指向容器中下一個元素。從邏輯上說,迭代器的自增操作和 int 型對象的自增操作類似。對 int 對象來說,操作結果就是把 int 型值“加 1”,而對迭代器對象則是把容器中的迭代器“向前移動一個位置”。因此,如果 iter 指向第一個元素,則 ++iter 指向第二個元素。

​ 由於 end操作返回的迭代器不指向任何元素,因此不能對它進行解引用或自增操作。

迭代器的其他操作

​ 另一對可執行於迭代器的操作就是比較:用== 或 != 操作符來比較兩個迭代器,如果兩個迭代器對象指向同一個元素,則它們相等,否則就不相等。

迭代器應用的程序示例

假設已聲明瞭一個vector<int> 型的 ivec 變量,要把它所有元素值重置爲 0,可以用下標操作來完成:

// reset all the elements in ivec to 0
for (vector<int>::size_type ix = 0; ix!= ivec.size(); ++ix)
    ivec[ix] = 0;

​ 上述程序用 for 循環遍歷 ivec 的元素,for 循環定義了一個索引 ix ,每循環迭代一次 ix 就自增1。for 循環體將 ivec 的每個元素賦值爲 0。

​ 更典型的做法是用迭代器來編寫循環:

// equivalent loop using iterators to resetall the elements in ivec to 0
for(vector<int>::iterator iter = ivec.begin();iter != ivec.end(); ++iter)
     *iter = 0;  // set element to which iter refers to 0

for 循環首先定義了 iter,並將它初始化爲指向 ivec 的第一個元素。for 循環的條件測試 iter 是否與 end 操作返回的迭代器不等。每次迭代 iter 都自增 1,這個 for 循環的效果是從 ivec 第一個元素開始,順序處理 vector 中的每一元素。最後, iter 將指向 ivec 中的最後一個元素,處理完最後一個元素後,iter 再增加 1,就會與 end 操作的返回值相等,在這種情況下,循環終止。

for 循環體內的語句用解引用操作符來訪問當前元素的值。和下標操作符一樣,解引用操作符的返回值是一個左值,因此可以對它進行賦值來改變它的值。上述循環的效果就是把 ivec 中所有元素都賦值爲 0。

​ 通過上述對代碼的詳細分析,可以看出這段程序與用下標操作符的版本達到相同的操作效果:從 vector 的第一個元素開始,把 vector 中每個元素都置爲 0。

​ 本節給出的例子程序,如果 vector 爲空,程序是安全的。如果 ivec 爲空,則 begin 返回的迭代器不指向任何元素——由於沒有元素,所以它不能指向任何元素。在這種情況下,從 begin 操作返回的迭代器與從 end 操作返回的迭代器的值相同,因此 for 語句中的測試條件立即失敗。

const_iterator

​ 前面的程序用vector::iterator 改變 vector 中的元素值。每種容器類型還定義了一種名爲 const_iterator 的類型,該類型只能用於讀取容器內元素,但不能改變其值。

​ 當我們對普通 iterator 類型解引用時,得到對某個元素的非 const。而如果我們對const_iterator 類型解引用時,則可以得到一個指向 const 對象的引用,如同任何常量一樣,該對象不能進行重寫。

​ 例如,如果 textvector<string> 類型,程序員想要遍歷它,輸出每個元素,可以這樣編寫程序:

// use const_iterator because we won'tchange the elements
for (vector<string>::const_iteratoriter = text.begin();iter != text.end(); ++iter)
    cout << *iter << endl; // printeach element in text

​ 除了是從迭代器讀取元素值而不是對它進行賦值之外,這個循環與前一個相似。由於這裏只需要藉助迭代器進行讀,不需要寫,這裏把 iter 定義爲 const_iterator 類型。當對 const_iterator 類型解引用時,返回的是一個 const 值。不允許用 const_iterator 進行賦值

 for (vector<string>::const_iteratoriter = text.begin();iter != text.end(); ++ iter)
   *iter = " ";     // error: *iter is const

​ 使用 const_iterator 類型時,我們可以得到一個迭代器,它自身的值可以改變,但不能用來改變其所指向的元素的值。可以對迭代器進行自增以及使用解引用操作符來讀取值,但不能對該元素賦值。

​ 不要把 const_iterator 對象與 constiterator 對象混淆起來。聲明一個 const 迭代器時,必須初始化迭代器。一旦被初始化後,就不能改變它的值:

vector<int> nums(10);  // nums is nonconst
const vector<int>::iterator cit =nums.begin();
*cit = 1; // ok: cit can change its underlying element
++cit; // error: can't change the value of cit

const_iterator對象可以用於const vector 或非 const vector,因爲不能改寫元素值。const 迭代器這種類型幾乎沒什麼用處:一旦它被初始化後,只能用它來改寫其指向的元素,但不能使它指向任何其他元素。

const vector<int> nines(10, 9);  // cannot change elements in nines
// error: cit2 could change the element itrefers to and nines is const
const vector<int>::iterator cit2 =nines.begin();
// ok: it can't change an element value, soit can be used with a const vector<int>
vector<int>::const_iterator it =nines.begin();
*it = 10; // error: *it is const
++it;    // ok: it isn't const so we can change its value
// an iterator that cannot write elements
vector<int>::const_iterator
// an iterator whose value cannot change
constvector<int>::iterator

迭代器的算術操作

​ 除了一次移動迭代器的一個元素的增量操作符外,vector 迭代器(其他標準庫容器迭代器很少)也支持其他的算術操作。這些操作稱爲迭代器算術操作(iterator arithmetic),包括:

iter + n
iter - n

​ 可以對迭代器對象加上或減去一個整型值。這樣做將產生一個新的迭代器,其位置在 iter 所指元素之前(加)或之後(減) n 個元素的位置。加或減之後的結果必須指向 iter 所指 vector 中的某個元素,或者是 vector 末端的後一個元素。加上或減去的值的類型應該是 vectorsize_typedifference_type 類型)。

iter1 - iter2

​ 該表達式用來計算兩個迭代器對象的距離,該距離是名爲 difference_typesigned 類型 size_type 的值,這裏的 difference_typesigned 類型,因爲減法運算可能產生負數的結果。該類型可以保證足夠大以存儲任何兩個迭代器對象間的距離。iter1iter2 兩者必須都指向同一 vector 中的元素,或者指向 vector 末端之後的下一個元素。

​ 可以用迭代器算術操作來移動迭代器直接指向某個元素,例如,下面語句直接定位於 vector 中間元素:

 vector<int>::iterator mid = vi.begin() +vi.size() / 2;

​ 上述代碼用來初始化 mid 使其指向 vi 中最靠近正中間的元素。這種直接計算迭代器的方法,與用迭代器逐個元素自增操作到達中間元素的方法是等價的,但前者的效率要高得多。

​ 任何改變 vector 長度的操作都會使已存在的迭代器失效。例如,在調用 push_back 之後,就不能再信賴指向 vector 的迭代器的值了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章