一、set簡介
C++ STL 之所以得到廣泛的讚譽,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封裝了許多複雜的數據結構算法和大量常用數據結構操作。vector封裝數組,list封裝了鏈表,map和set封裝了二叉樹,pair封裝二元結構體等,在封裝這些數據結構的時候,STL按照程序員的使用習慣,以成員函數方式提供的常用操作,如:插入、排序、刪除、查找等。讓用戶在STL使用過程中,並不會感到陌生。
set關聯式容器,在set中每個元素的值都唯一,而且系統能根據元素的值自動進行排序。
應該注意的是set中數元素的值不能直接被改變。C++ STL中標準關聯容器set, multiset, map, multimap內部採用的就是一種非常高效的平衡檢索二叉樹:紅黑樹,也成爲RB樹(Red-Black Tree)。RB樹的統計性能要好於一般平衡二叉樹,所以被STL選擇作爲了關聯容器的內部結構。
關於set有下面幾個問題:
(1)爲何map和set的插入刪除效率比用其他序列容器高?
大部分人說,很簡單,因爲對於關聯容器來說,不需要做內存拷貝和內存移動。說對了,確實如此。set容器內所有元素都是以節點的方式來存儲,其節點結構和鏈表差不多,指向父節點和子節點。結構圖可能如下:
A
/ \
B C
/ \ / \
D E F G
因此插入的時候只需要稍做變換,把節點的指針指向新的節點就可以了。刪除的時候類似,稍做變換後把指向刪除節點的指針指向其他節點也OK了。這裏的一切操作就是指針換來換去,和內存移動沒有關係。
(2)爲何每次insert之後,以前保存的iterator不會失效?
iterator這裏就相當於指向節點的指針,內存沒有變,指向內存的指針怎麼會失效呢(當然被刪除的那個元素本身已經失效了)。相對於vector來說,每一次刪除和插入,指針都有可能失效,調用push_back在尾部插入也是如此。因爲爲了保證內部數據的連續存放,iterator指向的那塊內存在刪除和插入過程中可能已經被其他內存覆蓋或者內存已經被釋放了。即使時push_back的時候,容器內部空間可能不夠,需要一塊新的更大的內存,只有把以前的內存釋放,申請新的更大的內存,複製已有的數據元素到新的內存,最後把需要插入的元素放到最後,那麼以前的內存指針自然就不可用了。特別時在和find等算法在一起使用的時候,牢記這個原則:不要使用過期的iterator。
(3)當數據元素增多時,set的插入和搜索速度變化如何?
如果你知道log2的關係你應該就徹底瞭解這個答案。在set中查找是使用二分查找,也就是說,如果有16個元素,最多需要比較4次就能找到結果,有32個元素,最多比較5次。那麼有10000個呢?最多比較的次數爲log10000,最多爲14次,如果是20000個元素呢?最多不過15次。看見了吧,當數據量增大一倍的時候,搜索次數只不過多了1次,多了1/14的搜索時間而已。你明白這個道理後,就可以安心往裏面放入元素了。
二、set成員函數列表:
begin 返回一個迭代器,此迭代器指向set中的第一個元素。
end 返回一個迭代器,此迭代器指向set最後一個元素的下一個位置
cbegin 返回一個常量迭代器,此迭代器指向set中的第一個元素。
cend 返回一個迭代器,此迭代器指向set最後一個元素的下一個位置
crbegin 返回一個常量迭代器,此迭代器指向反向set中的第一個元素。
crend 返回一個常量迭代器,此迭代器指向反向set中最後一個元素之後的位置。
emplace 將就地構造的元素插入到set。
emplace_hint 將就地構造的元素插入到set,附帶位置提示。
empty 如果set爲空,則返回 true。
clear 清除set的所有元素。
erase 從指定位置移除set中的元素或元素範圍。
find 返回一個迭代器,此迭代器指向set中其鍵與指定鍵相等的元素的位置。
get_allocator 返回集合中與給定值相等的上下限的兩個迭代器.
insert 將元素或元素範圍插入到set中的指定位置。
key_comp 將返回一個用於元素鍵值比較的函數
lower_bound 返回一個迭代器,此迭代器指向set中其鍵值等於或大於指定鍵的鍵值的第一個元素。
max_size 返回set的最大長度。
rbegin 返回一個迭代器,此迭代器指向反向set中的第一個元素。
rend 返回一個迭代器,此迭代器指向反向set中最後一個元素之後的位置。
size 返回set中的元素數量。
swap 交換兩個set的元素。
upper_bound 返回一個迭代器,此迭代器指向set中其鍵值大於指定鍵的鍵值的第一個元素。
三、set成員函數詳解:
3.1 set容器的創建
#include<bits/stdc++.h>
using namespace std;
set<int> s;
int main()
{ set<int > a; //默認是小於比較器less<int>的set
set<int, greater<int> > b; //創建一個帶大於比較器的set,需包含頭文件functional
int k[5] = {1,2,3,4,5};
set<int > c(k,k+5); //數組k初始化c;
set<int > d( c.begin(), c.end()); // 用c初始化d
//上述兩例均爲區間初始化
set<int > e( d ); //拷貝構造創建set
}
3.2 set容器的遍歷
3.2 set容器的增刪改查
3.2.1插入
#include<bits/stdc++.h>
using namespace std;
set<int >s;
void setprint(int cnt)
{ cout << "Test output :" << cnt << ":" << endl;
for(set<int>::iterator it = s.begin(); it!= s.end(); it++)
cout << *it << " ";
puts("");
return ;
}
int main(){
int cnt = 1;
s.insert(1);
s.insert(2);
s.insert(5);
setprint(cnt++);
s.insert(2); //set只允許用一個值出現一次,要插入相同元素請用multiset
setprint(cnt++);
int a[4] = {11,12,13,14};
s.insert(a,a+4); //將區間[a, a+4]裏的元素插入容器
setprint(cnt++);
}
結果爲:
3.2.2 刪除
s.erase() 刪除一個元素
s.clear() 刪除set容器中的所有的元素
#include<bits/stdc++.h>
using namespace std;
set<int> s;
void setprint(int cnt)
{ cout << "Test output :" << cnt << ":" << endl;
for(set<int>::iterator it = s.begin(); it!= s.end(); it++)
cout << *it << " ";
puts("");
return ;
}
int main()
{ int cnt = 1;
for(int i = 1; i < 11; i++)
s.insert(i);
setprint(cnt++);
s.erase(9); //根據元素刪除
setprint(cnt++);
set<int>::iterator ita = s.begin();
set<int>::iterator itb = s.begin();
s.erase(ita); //刪除迭代器指向位置的元素
setprint(cnt++);
ita = s.begin();
itb = s.begin();
itb++;itb++;
s.erase(ita,itb); //刪除區間[ita,itb)的元素
setprint(cnt);
s.clear();
return 0;
}
結果爲:
3.2.3 修改
不能直接修改容器內數據,所以只能刪除某元素再插入要修改的數值。
3.2.4 查找
s.find() 查找一個元素,如果容器中不存在該元素,返回值等於s.end()
#include<bits/stdc++.h>
using namespace std;
set<int >s;
void setprint(int cnt)
{ cout << "Test output :" << cnt << ":" << endl;
for(set<int>::iterator it = s.begin(); it!= s.end(); it++)
cout << *it << " ";
puts("");
return ;
}
int main()
{ int cnt = 1;
s.insert(1);
s.insert(2);
s.insert(5);
setprint(cnt++);
if(s.find(2) != s.end())
cout << "2 is existent" << endl;
else
cout << "2 is non-existent" << endl;
if(s.find(3) == s.end())
cout << "3 is non-existent" << endl;
else
cout << "2 is existent" << endl;
return 0;
}
結果爲:
3.3 判斷元素是否在set中 & 判斷set是否爲空
#include<bits/stdc++.h>
using namespace std;
int main()
{ set<int > s;
if(s.empty()) cout << "容器爲空" << endl;
s.insert(1);
if(!s.empty()) cout << "容器不爲空" << endl;
if(s.count(1)) cout << "1在容器中" << endl;
if(!s.count(2)) cout << "2不在容器中" << endl;
return 0;
}
結果爲:
簡單操作實例:
#include <bits/stdc++.h>
using namespace std;
int main()
{ set<int> s;
s.insert(1);
s.insert(2);
s.insert(3);
s.insert(1);
cout<<"set 的 size 值爲 :"<<s.size()<<endl;
cout<<"set 的 maxsize的值爲 :"<<s.max_size()<<endl;
cout<<"set 中的第一個元素是 :"<<*s.begin()<<endl;
cout<<"set 中的最後一個元素是:"<<*s.end()<<endl;
s.clear();
if(s.empty())
{
cout<<"set 爲空 !!!"<<endl;
}
cout<<"set 的 size 值爲 :"<<s.size()<<endl;
cout<<"set 的 maxsize的值爲 :"<<s.max_size()<<endl;
return 0;
}
運行結果:
小結:插入3之後雖然插入了一個1,但是我們發現set中最後一個值仍然是3哈,這就是set 。還要注意begin() 和 end()函數是不檢查set是否爲空的,使用前最好使用empty()檢驗一下set是否爲空.
count() 用來查找set中某個某個鍵值出現的次數。這個函數在set並不是很實用,因爲一個鍵值在set只可能出現0或1次,這樣就變成了判斷某一鍵值是否在set出現過了。
示例代碼:
#include <bits/stdc++.h>
using namespace std;
int main()
{
set<int> s;
s.insert(1);
s.insert(2);
s.insert(3);
s.insert(1);
cout<<"set 中 1 出現的次數是 :"<<s.count(1)<<endl;
cout<<"set 中 4 出現的次數是 :"<<s.count(4)<<endl;
return 0;
}
equal_range() ,返回一對定位器,分別表示第一個大於或等於給定關鍵值的元素和 第一個大於給定關鍵值的元素,這個返回值是一個pair類型,如果這一對定位器中哪個返回失敗,就會等於end()的值。
#include <bits/stdc++.h>
using namespace std;
int main()
{ set<int> s;
set<int>::iterator iter;
for(int i = 1 ; i <= 5; ++i)
s.insert(i);
for(iter = s.begin() ; iter != s.end() ; ++iter)
cout<<*iter<<" ";
cout<<endl;
pair<set<int>::const_iterator,set<int>::const_iterator> pr;
pr = s.equal_range(3);
cout<<"第一個大於等於 3 的數是 :"<<*pr.first<<endl;
cout<<"第一個大於 3的數是 : "<<*pr.second<<endl;
return 0;
}
erase(iterator) ,刪除定位器iterator指向的值
erase(first,second),刪除定位器first和second之間的值
erase(key_value),刪除鍵值key_value的值
看看程序吧:
#include <bits/stdc++.h>
using namespace std;
int main()
{
set<int> s;
set<int>::const_iterator iter;
set<int>::iterator first;
set<int>::iterator second;
for(int i = 1 ; i <= 10 ; ++i)
s.insert(i);
}
//第一種刪除
s.erase(s.begin());
//第二種刪除
#include <bits/stdc++.h>
using namespace std;
int main()
{
first = s.begin();
second = s.begin();
second++;
second++;
s.erase(first,second);
}
//第三種刪除
#include <bits/stdc++.h>
using namespace std;
int main()
{ s.erase(8);
cout<<"刪除後 set 中元素是 :";
for(iter = s.begin() ; iter != s.end() ; ++iter)
cout<<*iter<<" ";
cout<<endl;
return 0;
}
運行結果:
小結:set中的刪除操作是不進行任何的錯誤檢查的,比如定位器的是否合法等等,所以用的時候自己一定要注意。
find() ,返回給定值值得定位器,如果沒找到則返回end()。
示例代碼:
#include <iostream>
#include <set>
using namespace std;
int main()
{
int a[] = {1,2,3};
set<int> s(a,a+3);
set<int>::iterator iter;
if((iter = s.find(2)) != s.end())
{
cout<<*iter<<endl;
}
return 0;
}
insert(key_value); 將key_value插入到set中 ,返回值是pair<set<int>::iterator,bool>,bool標誌着插入是否成功,而iterator代表插入的位置,若key_value已經在set中,則iterator表示的key_value在set中的位置。
inset(first,second);將定位器first到second之間的元素插入到set中,返回值是void.
示例代碼:
#include <iostream>
#include <set>
using namespace std;
int main()
{
int a[] = {1,2,3};
set<int> s;
set<int>::iterator iter;
s.insert(a,a+3);
for(iter = s.begin() ; iter != s.end() ; ++iter)
{
cout<<*iter<<" ";
}
cout<<endl;
pair<set<int>::iterator,bool> pr;
pr = s.insert(5);
if(pr.second)
{
cout<<*pr.first<<endl;
}
return 0;
}
lower_bound(key_value) ,返回第一個大於等於key_value的定位器
upper_bound(key_value),返回最後一個大於等於key_value的定位器
示例代碼:
#include <iostream>
#include <set>
using namespace std;
int main()
{
set<int> s;
s.insert(1);
s.insert(3);
s.insert(4);
cout<<*s.lower_bound(2)<<endl;
cout<<*s.lower_bound(3)<<endl;
cout<<*s.upper_bound(3)<<endl;
return 0;
}
通過algorithm中提供的set_intersection、set_union、set_difference、set_symmetric_difference四個函數,可以方便的實現集合的交、並、差、對稱差操作,很實用!
微軟幫助文檔中對集合(set)的解釋: “描述了一個控制變長元素序列的對象(注:set中的key和value是Key類型的,而map中的key和value是一個pair結構中的兩個分 量)的模板類,每一個元素包含了一個排序鍵(sort key)和一個值(value)。對這個序列可以進行查找、插入、刪除序列中的任意一個元素,而完成這些操作的時間同這個序列中元素個數的對數成比例關 系,並且當遊標指向一個已刪除的元素時,刪除操作無效。”
而一個經過更正的和更加實際的定義應該是:一個集合(set)是一個容器,它其中所包含的元素的值是唯一的。這在收集一個數據的具體值的時候是有用的。集 閤中的元素按一定的順序排列,並被作爲集合中的實例。如果你需要一個鍵/值對(pair)來存儲數據,map是一個更好的選擇。一個集合通過一個鏈表來組 織,在插入操作和刪除操作上比向量(vector)快,但查找或添加末尾的元素時會有些慢。
下面是四個函數的標準用法:
#include<bits/stdc++.h>
using namespace std;
int main()
{ int a[] = { 0, 1, 2, 3, 4, 5, 6, 7, 8 };
set<int> S( a, a + 9 );
int b[] = { 3, 6, 8, 9 };
set<int> S2( b, b + 4 );
set<int>::iterator site;
set<int> Su;
set<int> Si;
set<int> Sd;
set<int> Ssd;
//交集
set_intersection(S.begin(),S.end(),S2.begin(),S2.end(),inserter(Si,Si.begin()));
//並集
set_union(S.begin(),S.end(),S2.begin(),S2.end(),inserter(Su,Su.begin()));
//差集
set_difference( S.begin(), S.end(),S2.begin(),S2.end(),inserter(Sd,Sd.begin()));
//對稱差集
set_symmetric_difference(S.begin(),S.end(),S2.begin(),S2.end(),inserter(Ssd,Ssd.begin()));
site = Si.begin();
cout<<"the intersection of S and S2 is : ";
while( site != Si.end() )
{ cout<< *site <<" ";
++ site;
}
cout<<endl;
site = Su.begin();
cout<<"the union of S and S2 is : ";
while( site != Su.end() )
{ cout<< *site <<" ";
++ site;
}
cout<<endl;
site = Sd.begin();
cout<<"the difference of S and S2 is : ";
while( site != Sd.end() )
{ cout<< *site <<" ";
++ site;
}
cout<<endl;
site = Ssd.begin();
cout<<"the symmetric difference of S and S2 is : ";
while( site != Ssd.end() )
{ cout<< *site <<" ";
++ site;
}
cout<<endl;
return 0;
}
運行結果爲:
四、應用舉例:
1、P2141 珠心算測驗