C++标准库STL容器详解
目录
C++标准模板库STL容器
容器都是类模板,它们实例化后就成为容器类。用容器类定义的对象称为容器对象。对象或变量插入容器时,实际插入的是对象或变量的一个复制品。
容器分类
顺序容器
1、元素在容器中的位置同元素的值无关,即容器不是排序的。
2、顺序容器包括:vector、deque、list。
关联容器
1、关联容器内的元素是有规则排列的(排序或加入哈希桶),插入元素时,容器会按一定的排序规则将元素放在适当的位置上。因为按规则排列,关联容器在查找时具有非常好的性能。
2、关联容器包括:set、multiset、map、multimap、unordered_set、unordered_multiset、unordered_map、std::unordered_multimap等。
3、不能修改关联容器中key的值,因为元素修改后容器并不会自动重新排序。正确的做法的是, 先删除该元素,再插入新元素。
容器适配器
1、STL在两类容器的基础上屏蔽一部分功能,突出或增加另一部分功能,实现了容器适配器。
2、STL中容器适配器有stack、queue、priority_queue三种,它们都是在顺序容器的基础上实现的。
容器通用接口
所有容器
int size( ) 返回容器对象中元素的个数
bool empty( ) 判断容器对象是否为空
顺序容器
front() 返回容器中第一个元素的引用
back() 返回容器中最后一个元素的引用
push_back() 在容器末尾增加新元素
pop_back() 删除容器末尾的元素
insert() 插入一个或多个元素
顺序容器和关联容器
begin( ) 返回指向容器中第一个元素的迭代器
end( ) 返回指向容器中最后一个元素后面的位置的迭代器
rbegin( ) 返回指向容器中最后一个元素的反向迭代器
rend( ) 返回指向容器中第一个元素前面的位置的反响迭代器
erase( ) 从容器中删除一个或几个元素
clear( ) 从容器中删除所有的元素
如果一个容器为空,则begin()和end()的返回值相等,rbegin()和rend()的返回值也相等
容器适配器
push:添加一个元素
top:返回顶部或对头的元素的引用
pop:删除一个元素
顺序容器
vector
动态数组,也叫可变长数组,在堆中分配内存,元素存放在连续的内存空间,支持下标随机访问,元素可重复,且是无序存放。
2、在头部或中间进行插入和删除操作时,会造成内存块的拷贝;对尾部进行插入和删除时一般不会拷贝内存;扩容时会内存拷贝。
扩容方式
开辟二倍的内存;旧的数据拷贝到新的内存;释放旧内存;重新指向新内存。
时间复杂度
1、[ ]或at()下标访问任意元素,时间复杂度是O(1)。
2、push_back尾部插入、pop_back尾部删除,时间复杂度O(1)。
3、insert插入、erase删除时间复杂度O(n)。
#include std::vector<int> _v; _v.push_back(20);//尾部添加元素 _v.push_back(10); _v.push_back(10);//{20,10,10} printf("_v.front=%d\n",_v.front());//队首元素,_v.front=20 printf("_v.back=%d\n",_v.back());//队尾元素,_v.back=10 _v.pop_back();//移除尾部元素,{20,10} _v.insert(_v.begin() + 1, 30); //在指定的位置插入元素10的拷贝,{20,30,10} _v.erase(_v.begin() + 2);//删除指定位置的元素,{20,30} //遍历,可以使用下标遍历,也可以使用迭代器遍历 auto iter = _v.begin(); while(iter != _v.end()) { printf("value=%d\n",*iter); iter++; } printf("_v[0]=%d,_v.at(1)=%d\n",_v[0],_v.at(1));//下标访问,越界crash,at抛出异常
打印
_v.front=20_v.back=10value=20value=30_v[0]=20,_v.at(1)=30
list
双向链表,存放在堆中,内存空间是不连续的,每个元素都存放在一块内存中,通过指针指向上一个元素和下一个元素。元素可重复,且是无序存放。
2、不需要扩容,添加元素时分配内存,删除元素时回收内存。
3、在任何位置添加和删除元素效率都很高,无需内存拷贝。
4、不能下标随机访问,访问任意元素效率低。
时间复杂度
1、访问首部和尾部是O(1),访问其他元素是O(n)。
2、push_back、push_front、insert插入是O(1),pop_front、pop_back、erase删除是O(1)。
#include
std::list<int> _l; _l.push_back(20);//尾部添加元素 _l.push_back(30); _l.push_back(40); _l.push_front(10);//头部添加元素{10,20,30,40} printf("_l.front=%d\n",_l.front());//访问队首元素,_l.front=10 printf("_l.back=%d\n",_l.back());//访问队尾元素,_l.back=40 _l.pop_back();//移除尾部元素,{10,20,30} _l.pop_front();//移除头部元素,{20,30} //list迭代器只能++/--,不能+i随机访问 _l.erase(_l.begin());//删除指定位置的元素,{30} _l.insert(++_l.begin(), 50); //在指定的位置插入元素10的拷贝,{30,50} //使用迭代器遍历,不能使用下标访问 auto iter = _l.begin(); while(iter != _l.end()) { printf("value=%d\n",*iter); iter++; }
打印
_l.front=10_l.back=40value=30value=50
deque
双端队列,deque类似于一个二维数组,由多个连续小空间拼接而成,引入map管理分段空间;map是一块连续的空间,map的每个元素是指向缓存区buffer的指针,每个缓存区buffer存储多个元素。
2、deque底层是假象的连续空间,实际上是分段连续的,为了“整体连续”和下标随机访问,deque定义了复杂的迭代器,实现随机访问。
3、deque结合了vector和list的优缺点,在队首和队尾进行插入和删除操作时效率高,遍历和排序效率低,中间插入和删除元素仍然存在内存拷贝,随机访问时需要计算数据在哪个buffer的第几个数据,效率低于vector。
4、deque功能全面,但效率普遍较低,实际应用时很少使用,通常作为stack和queue的底层默认容器(stack和queue不需要遍历,只需要在固定的一端或者两端进行操作,且deque扩容时不需要内存拷贝)。
时间复杂度
1、访问首部和尾部是O(1),下标访问其他元素时接近O(1)。
2、push_back、push_front插入是O(1),pop_front、pop_back删除是O(1)。
3、insert插入、erase删除时间复杂度O(n)。
支持首尾添加元素/访问元素/移除元素,支持下标访问和迭代器随机访问,几乎支持vector和list的所有功能。
#include std::deque<int> _d; _d.push_back(20);//尾部添加元素 _d.push_back(30); _d.push_back(40); _d.push_front(10);//头部添加元素{10,20,30,40} printf("_d.front=%d\n",_d.front());//访问队首元素,_d.front=10 printf("_d.back=%d\n",_d.back());//访问队尾元素,_d.back=40 _d.pop_back();//移除尾部元素,{10,20,30} _d.pop_front();//移除头部元素,{20,30} _d.erase(_d.begin());//删除指定位置的元素,{30} _d.insert(_d.begin() + 1, 80); //在指定的位置插入元素,{30,80} //使用迭代器遍历 auto iter = _d.begin(); while(iter != _d.end()) { printf("value=%d\n",*iter); iter++; } printf("_d[0]=%d,_d.at(1)=%d\n",_d[0],_d.at(1));//下标访问,越界crash,at抛出异常
打印
_d.front=10_d.back=40value=30value=80_d[0]=30,_d.at(1)=80
容器适配器
queue
队列,先进先出的数据结构,只支持在队尾添加元素,在队首删除元素。
2、queue可以指定底层容器(例如std::queue
3、queue不提供迭代器访问,不能使用下标访问。
时间复杂度
1、插入push和删除pop是O(1)。
2、front和back访问是O(1)。
#include std::queue<int> _q; _q.push(10);//尾部添加元素 _q.push(20); _q.push(30); _q.push(40);//{10,20,30,40} printf("_q.front=%d\n",_q.front());//访问队首元素,_q.front=10 printf("_q.back=%d\n",_q.back());//访问队尾元素,_q.back=40 _q.pop();//移除队首元素,{20,30,40} //不能使用下标和迭代器访问
打印
_q.front=10_q.back=40
stack
数据栈,先进后出的数据结构,单端口进出,数据入栈只能加入栈顶,数据出栈也只能取栈顶的元素。
2、stack和queue数据结构类似,可以指定底层容器,默认是deque,分数组栈和链表栈。
3、stack不提供迭代器访问,不能使用下标访问。
时间复杂度
1、入栈push和出栈pop是O(1)。
2、top访问是O(1)。
#include std::stack<int> _s; _s.push(10);//顶部添加元素 _s.push(20); _s.push(30); _s.push(40);//{10,20,30,40} printf("_s.top=%d\n",_s.top());//访问顶部元素,_s.top=40 _s.pop();//移除顶部元素,{10,20,30}
priority_queue
优先级队列 priority_queue,常用来对数据进行优先级处理,比如优先级高的值在前面,常用堆(Heap)来实现,底层是以vector数组存储的完全二叉树。
2、优先级队列是一个拥有权值的queue,其内部元素按照元素的权值排列。权值较高者排在最前优先出队。
3、priority_queue不提供迭代器访问,不能使用下标访问。
堆是一种特殊的树,只要满足以下两个条件,就可以称这棵树为堆:
1、堆是一颗完全二叉树(完全二叉树要求,除了最后一层,其他节点个数都是满的,最后一层的节点都靠左排列)。
2、堆中的每一个节点都必须大于等于(或者小于等于)其子树中每个节点的值。
时间复杂度
1、使用vector数组构造priority_queue是O(n)。
2、插入元素push和移除堆顶pop是O(log(n))。
3、访问堆顶top是O(1)。
以下面程序举例,数据结构如下
#include std::vector<int> v{ 1,2,3,4,5,6,7,8,9,10 }; std::priority_queue<int> p1(v.begin(), v.end());//使用vector数组构造大顶堆 printf("p1.top=%d\n",p1.top());//访问顶部元素,.top=10// std::priority_queue ,std::greater > _p2;//小顶堆 std::priority_queue<int> _p;//默认大顶堆 _p.push(56);//添加一个元素,自动排序 _p.push(15); _p.push(70); _p.push(30); _p.push(10); _p.push(25);//{70,30,56,15,10,25} printf("_p.top=%d\n",_p.top());//访问顶部元素,_p.top=70 _p.pop();//移除顶部元素,重新排序,{56,30,25,15,10}
打印
p1.top=10_p.top=70
关联容器:红黑树
set
set是排序的、不重复的数据集合。
2、set元素类型是pair,存储键值对,且key和value必须相等。
3、set中的元素不能直接改变,可以先删除再添加。
4、set底层是以红黑树数据结构实现,节点存储值key。
5、set在内存中表现为一个排序的数组。
6、不支持下标访问。
时间复杂度
1、插入、删除、查找,都是严格在O(logn)时间内完成。
#include std::set<int> s1;//定义一个空set std::set<int>::iterator it;//s1的迭代器类型 std::pair<std::set<int>::iterator,bool> ret;//插入数据的返回值类型,first是指向插入数据的迭代器,second标识是否插入成功 // 单个数据插入 for (int i=1; i<=5; ++i) s1.insert(i*10); // {10,20,30,40,50} ret = s1.insert(20); // 重复插入时失败,返回的迭代器指向容器中已存在的值,bool为false if (ret.second==false) it=ret.first; // "it" now points to element 20 s1.erase(50);// 通过值删除元素,{10,20,30,40} s1.insert (it,25);//通过迭代器插入,{10,20,25,30,40} //区间插入 int myints[]= {5,10,15}; s1.insert (myints,myints+3); //迭代器遍历访问 for (it=s1.begin(); it!=s1.end(); ++it) printf("*it=%d ",*it); printf("\n"); auto iter = s1.find(20);//find查询元素是否在set集合中 if(iter != s1.end()) { printf("found 20\n"); }
打印
*it=5 *it=10 *it=15 *it=20 *it=25 *it=30 *it=40 found 20
multiset
multiset类似与set,区别在于multiset支持插入重复的元素,insert函数没有返回值,有重复元素时count函数返回值大于1。
map
map中存储的是键值对
2、map底层是以红黑树数据结构实现。
3、使用迭代器可以对value进行修改,但不能修改key,若要修改key,可以先删除再添加。
4、可以通过[key]或at(key)下标访问,若map中没有该key,则[ ]会向map中添加键值对,at()抛出异常或crash。
5、map在内存中表现为根据key排序的一组键值对。
时间复杂度
1、插入、删除、查找,都是严格在O(logn)时间内完成。
#include std::map<int,std::string> map1;//定义一个空map std::map<int,std::string>::iterator it;//map1的迭代器类型 //插入数据的返回值类型,first是指向插入数据的迭代器,second标识是否插入成功 std::pair<std::map<int,std::string>::iterator,bool> ret; //1.通过pair(1,"lilei") 构造pair元素 map1.insert(std::pair<int, std::string>(1,"lilei")); //2.通过make_pair构造pair元素 map1.insert(std::make_pair(2,"hmm")); //3.通过value_type构造pair元素 map1.insert(std::map<int, std::string>::value_type(3,"zsan")); //4.[ ]下标插入 map1[4] = "zsi"; //5.emplace插入 map1.emplace(5,"chw"); ret = map1.emplace(2,"hmei"); if(ret.second == false)//插入失败,返回false printf("ret.first=%s\n",ret.first->second.c_str()); bool ret2 = map1.erase(1);//通过key删除元素,成功返回true,失败返回false printf("erase ret2=%d\n",ret2); //find查找key auto iter_find = map1.find(3); if(iter_find != map1.end()) { printf("find key=%d,value=%s\n",iter_find->first,iter_find->second.c_str()); } //迭代器安全删除 std::map<int,std::string>::iterator ite_es = map1.begin(); while(ite_es != map1.end()) { if(ite_es->first == 3) { ite_es = map1.erase(ite_es); } else ++ite_es; } //迭代器遍历 auto iter_bl = map1.begin(); while(iter_bl != map1.end()) { printf("key=%d,value=%s\n",iter_bl->first,iter_bl->second.c_str()); ++iter_bl; }
打印
ret.first=hmmerase ret2=1find key=3,value=zsankey=2,value=hmmkey=4,value=zsikey=5,value=chw
multimap
multimap类似与map,区别在于multimap支持插入重复的元素,insert和emplace函数没有返回值,有重复元素时count函数返回值大于1。multimap不能使用[ ]下标插入。
关联容器:哈希表
unordered_set和unordered_multiset
这两个容器的操作集类似于set和multiset,区别在于unordered_set和unordered_multiset的底层数据结构是哈希表。
2、哈希表是通过把key进行哈希运算,分配到哈希桶,哈希桶内使用链表法解决哈希冲突。通过key就可以快速找到哈希桶的位置,因此查找效率高。
时间复杂度
1、在没有哈希冲突的情况下,查找是O(1)。
unordered_map和unordered_multimap
这两个容器的操作集类似于map和multimap,区别在于unordered_map和unordered_multimap的底层数据结构是哈希表。
2、哈希表是通过把key进行哈希运算,分配到哈希桶,哈希桶内使用链表法解决哈希冲突。通过key就可以快速找到哈希桶的位置,因此查找效率高。
时间复杂度
1、在没有哈希冲突的情况下,查找是O(1)。
unordered_map用法参考这里:https://blog.csdn.net/weixin_40355471/article/details/131803322?spm=1001.2014.3001.5502。
附1:红黑树数据结构
红黑树并不是严格的平衡二叉树,它要求从根到叶子的最长路径不多于最短路径的两倍长,为了满足这个特性,红黑树设置了五大规则:
节点是红色或者黑色
2、根节点是黑色
3、每个叶子的节点都是黑色的空节点
4、每个红色节点的两个子节点都是黑色的
5、从任意节点到其叶子节点的每条路径都包含相同个数的黑色节点
红黑树的高度近似logn,是近似平衡的二叉树,插入、删除、查找的时间复杂度都是O(logn),性能非常稳定,在实际工作中,凡是动态插入、删除、查找数据的场景都可以用它。
附2:哈希表数据结构
哈希表也叫散列表(Hash table),是根据关键码值(Key value)而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
下图是一个典型应用,key经过哈希函数计算得到哈希值,哈希值对一个常数n取模得到下标,通过下标可以直接访问哈希桶,哈希桶内存放
附3:reserve和resize
这两个函数常用于STL容器容量操作。
1、reserve,只分配空间,不创建对象,不可访问,用于大量成员创建,一次性分配空间,push_back时就不用再分配,提高执行效率。
2、resize,分配空间的同时还创建对象,并给对象赋初始值,可访问。
std::vector<int> v1; v1.resize(5);//分配空间并初始化对象为0,此时元素个数是5 v1.push_back(10); for(int index=0;index<v1.size();index++) printf("v1[%d]=%d ",index,v1[index]); printf("\n"); std::vector<int> v2; v2.reserve(5);//只分配空间,不创建对象,此时元素个数是0 v2.push_back(20); for(int index=0;index<v2.size();index++) printf("v2[%d]=%d ",index,v2[index]); printf("\n");
打印
v1[0]=0 v1[1]=0 v1[2]=0 v1[3]=0 v1[4]=0 v1[5]=10 v2[0]=20
来源地址:https://blog.csdn.net/weixin_40355471/article/details/132534923
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341