假设我们有一个有序链表A,其中元素为1,3,4,5,7,8,9,10,13,16,17,18
我们在找寻其中的元素的时候,需要我们从头开始向下找寻。因此时间复杂度为O(n)。为了减少时间复杂度,我们提出了跳表的概念
原始链表
跳表
可以看到,我们实际上做的就是给原有的链表加上了索引,和B+树的索引类似。当我们需要找10时,会发现一级索引中的9小于10,但是下一个元素13又大于10。因此我们从9的位置开始,在原始链表中遍历找寻。这样我们查找的路径变小了。
同理,我们还可以加上二级索引
同理我们在插入数据时也是在原始链表中找到相应位置,插入。
但是当两个索引之间的元素过多时,就有了索引失效的情况出现。对于这种情况,我们只需要重建索引,时间复杂度为O(n)。具体重建方法就是可以在n/2处建立二级索引,在n/4处建立三级索引,依次。尽量让该元素有 1/2 的几率建立一级索引、1/4 的几率建立二级索引、1/8 的几率建立三级索引。现在我们就需要一个概率算法帮我们把控这个 1/2、1/4、1/8 ... ,当每次有数据要插入时,先通过概率算法告诉我们这个元素需要插入到几级索引中,然后开始维护索引并把数据插入到原始链表中。
我们可以实现一个 randomLevel() 方法,该方法会随机生成 1~MAX_LEVEL 之间的数(MAX_LEVEL表示索引的最高层数),且该方法有 1/2 的概率返回 1、1/4 的概率返回 2、1/8的概率返回 3,以此类推。
- randomLevel() 方法返回 1 表示当前插入的该元素不需要建索引,只需要存储数据到原始链表即可(概率 1/2)
- randomLevel() 方法返回 2 表示当前插入的该元素需要建一级索引(概率 1/4)
- randomLevel() 方法返回 3 表示当前插入的该元素需要建二级索引(概率 1/8)
- randomLevel() 方法返回 4 表示当前插入的该元素需要建三级索引(概率 1/16)
- 。。。以此类推
int randomLevel() {int lv = 1;// MAXL = 32, S = 0xFFFF, PS = S * P, P = 1 / 4while ((rand() & S) < PS) ++lv;return min(MAXL, lv);
}
删除数据时,我们需要将包含该数据的索引也相应删除