跳表(skiplist)是在有序链表的基础上进行了扩展,解决了有序链表结构查找特定值困难的问题,实现插入、删除、查找的复杂度均为O(logN),他是一种可以代替平衡树的数据结构。LevelDB的核心数据结构是用跳表实现的,redis的sorted set数据结构也是有跳表实现的。(参考维基百科:https://en.wikipedia.org/wiki/Skip_list)
其结构如下图所示:
一、查找
在如下链表中查找x
从最上层的链(S3)的开头开始,假设当前位置为p,它向右指向的节点为q(p与q不一定相邻),且q的值为y。将y与x作比较:
(1) x=y 输出查询成功及相关信息
(2) x>y 从p向右移动到q的位置
(3) x<y 从p向下移动一格
如果当前位置在最底层的链中(S0),且还要往下移动的话,则输出查询失败。当x=53时候:11<53&&53<max,下移;11<53&&53<30,右移;53<53,命中。
二、插入
首先明确,向跳跃表中插入一个元素,相当于在表中插入一列从S0中某一位置出发向上的连续一段元素。有两个参数需要确定,即插入列的位置以及它的“高度”。
关于插入的位置,我们先利用跳跃表的查找功能,找到比x小的最大的数y。根据跳跃表中所有链均是递增序列的原则,x必然就插在y的后面。
而插入列的“高度”较前者来说显得更加重要,也更加难以确定。由于它的不确定性,使得不同的决策可能会导致截然不同的算法效率。为了使插入数据之后,保持该数据结构进行各种操作均为O(logn)复杂度的性质,我们引入随机化算法(Randomized Algorithms)来确定链表的高度。
插入元素“40”,且在执行了随机决策模块后得到高度为4
步骤一:找到表中比40小的最大的数,确定插入位置
插入高度为4的列,并维护跳跃表的结构
三、删除
删除操作分为以下三个步骤:
在跳跃表中查找到这个元素的位置,如果未找到,则退出
将该元素所在整列从表中删除
将多余的“空链”删除