我們再來看看另外一個常用的Java類——java.util.Vector。簡單地說,一個Vector就是一個java.lang.Object實例的數組。Vector與數組相似,它的元素可以通過整數形式的索引訪問。但是,Vector類型的對象在創建之後,對象的大小能夠根據元素的增加或者刪除而擴展、縮小,請考慮下面這個向Vector加入元素的例子:
Object obj = new Object();
?Vector v = new Vector(100000);
?for(int I=0;
?I<100000; I++) { v.add(0,obj); }
除非有絕對充足的理由要求每次都把新元素插入到Vector的前面,否則上面的代碼對性能不利。在默認構造函數中,Vector的初始存儲能力是10個元素,如果新元素加入時存儲能力不足,則以後存儲能力每次加倍。Vector類就象StringBuffer類一樣,每次擴展存儲能力時,所有現有的元素都要複製到新的存儲空間之中。下面的代碼片段要比前面的例子快幾個數量級:
Object obj = new Object();
Vector v = new Vector(100000);
for(int I=0; I<100000; I++) { v.add(obj); }
同樣的規則也適用於Vector類的remove()方法。由於Vector中各個元素之間不能含有“空隙”,刪除除最後一個元素之外的任意其他元素都導致被刪除元素之後的元素向前移動。也就是說,從Vector刪除最後一個元素要比刪除第一個元素“開銷”低好幾倍。
假設要從前面的Vector刪除所有元素,我們可以使用這種代碼:
for(int I=0; I<100000; I++){ v.remove(0); }
但是,與下面的代碼相比,前面的代碼要慢幾個數量級:
for(int I=0; I<100000; I++){ v.remove(v.size()-1); }
從Vector類型的對象v刪除所有元素的最好方法是:
v.removeAllElements();
假設Vector類型的對象v包含字符串“Hello”。考慮下面的代碼,它要從這個Vector中刪除“Hello”字符串:
String s = "Hello"; int i = v.indexOf(s); if(I != -1) v.remove(s);
這些代碼看起來沒什麼錯誤,但它同樣對性能不利。在這段代碼中,indexOf()方法對v進行順序搜索尋找字符串“Hello”,remove(s)方法也要進行同樣的順序搜索。改進之後的版本是:
String s = "Hello"; int i = v.indexOf(s); if(I != -1) v.remove(i);
這個版本中我們直接在remove()方法中給出待刪除元素的精確索引位置,從而避免了第二次搜索。一個更好的版本是:
String s = "Hello"; v.remove(s);
最後,我們再來看一個有關Vector類的代碼片段:
for(int I=0; I<v.size();I++ );
如果v包含100,000個元素,這個代碼片段將調用v.size()方法100,000次。雖然size方法是一個簡單的方法,但它仍舊需要一次方法調用的開銷,至少JVM需要爲它配置以及清除堆棧環境。在這裏,for循環內部的代碼不會以任何方式修改Vector類型對象v的大小,因此上面的代碼最好改寫成下面這種形式:
int size = v.size(); for(int I=0; I<size ; I++ );
雖然這是一個簡單的改動,但它仍舊贏得了性能。畢竟,每一個CPU週期都是寶貴的。
拙劣的代碼編寫方式導致代碼性能下降。但是,正如本文例子所顯示的,我們只要採取一些簡單的措施就能夠顯著地改善代碼性能。
Vector 類提供了實現可增長數組的功能,隨着更多元素加入其中,數組變的更大。在刪除一些元素之後,數組變小,增長長度是原來的一倍。他支持進程同步.
Vector 有三個構造函數:
public Vector(int initialCapacity,int capacityIncrement)
public Vector(int initialCapacity)
public Vector()
Vector 運行時創建一個初始的存儲容量initialCapacity,存儲容量是以capacityIncrement 變量定義的增量增長。初始的存儲容量和capacityIncrement 可以在Vector 的構造函數中定義。第二個構造函數只創建初始存儲容量。第三個構造函數既不指定初始的存儲容量也不指定capacityIncrement。
Vector 類提供的訪問方法支持類似數組運算和與Vector 大小相關的運算。類似數組的運算允許向量中增加,刪除和插入元素。它們也允許測試矢量的內容和檢索指定的元素,與大小相關的運算允許判定字節大小和矢量中元素不數目。
現針對經常用到的對向量增,刪,插功能舉例描述:
addElement(Object obj)
把組件加到向量尾部,同時大小加1,向量容量比以前大1
insertElementAt(Object obj, int index)
把組件加到所定索引處,此後的內容向後移動1 個單位
setElementAt(Object obj, int index)
把組件加到所定索引處,此處的內容被代替。
removeElement(Object obj) 把向量中含有本組件內容移走。
removeAllElements() 把向量中所有組件移走,向量大小爲0。
比較了一下數組和vector的[]操作的效率。相差還是很多的.
vector<int> a(100);
int b[100];
struct timeval ss, se, us, ue;
gettimeofday(&ss, NULL);
vector<int>::iterator it;
for (int i=0; i<1000000; i++) {
for (int j=0;j<100; j++) {//it=a.begin(); it<a.end(); it++) {
a[j] = 1;
}
}
gettimeofday(&se, NULL);
gettimeofday(&us, NULL);
for (int i=0; i<1000000; i++) {
for (int j=0; j<100; j++) {
b[j] = 1;
}
}
gettimeofday(&ue, NULL);
vector operation: 6067.690000 ms, 606.769000 us per req
array operation: 468.589000 ms, 46.858900 us per req
相差10幾倍。在一個內部循環中(如果超過億數量級),用vector和數組差別還是很大的。
對於一個100個元素的數組,做循環,vector大概要用到10m/億次, 數組用到45s/億次 左右。
參考資料:http://hi.baidu.com/kittig/item/3e439c8f80ff6a874514cf68