最近几天重温了《STL源码剖析》这部著作,对一些知识点做个记录。
vector的技术实现,关键在于其对大小的控制以及重新配置时的数据移动效率。一旦vector旧有空间满载,如果客户端每新增一个元素,vector内部只是扩充一个元素的空间,实为不智,因为所谓扩大空间(不论多大),一如稍早所说,是“配置新空间/数据移动/释放旧空间”的大工程,时间成本很高,应该加入某种未雨绸缪的考虑。
所谓动态增加大小,并不是在原空间之后接续新空间(因为无法保证原空间之后上油可供配置的空间),而是以原大小的两倍另外配置一块较大空间,然后将原内容拷贝过来,然后才开始在原内容之后构造新元素,并释放原空间。因此,对vector的任何操作,一旦引起空间重新配置,指向原vector的所有迭代器旧都失效了。(摘自《STL源码剖析》)
先来看下vector是如何拓展空间的
int main()
{
std::vector<int> vec;
int lastCapacity = 0;
for (size_t i = 0; i < 100; i++)
{
vec.push_back(i);
if (lastCapacity!= vec.capacity())
{
lastCapacity = vec.capacity();
std::cout << i << "->" << lastCapacity << "->" << &vec[0] << "\n";
}
}
getchar();
}
运行结果:
可以看到新增一个元素没有剩余空间时,就会扩展新的空间(新增加的空间约为0.5倍的旧空间),并把内容移动到新的地址。
由于需要不断移动数据,因此频繁新增元素(不断开辟新空间/移动数据)会带来额外的时间开销。
简单测试下效率影响:
测试结果:
通过测试结果看,频繁新增元素带来的时间开销还是比较大的,这还是数据比较少的情况,数据越多效率影响会越大。