淘先锋技术网

首页 1 2 3 4 5 6 7

1.概述

LinkedList 实现了队列接口 Queue 和双端队列接口 Deque ,Java 容器类中还有一个双端队列的实现类 ArrayDeque ,它是基于数组实现的。一般来说,由于需要移动元素,数组的插入和删除效率会非常低,但 ArrayDeque 的效率却非常高,本章我们就来讨论一下它具体是如何实现的。

可能很多读者认为java开发中容器用的最多的就是ArrayList了,没有什么东西ArrayList搞不定的,作为程序员的您有没有这样的感觉呢?如果您有这种感觉请您看完我的整篇文章。

1.1 构造方法,老生之谈

d0bd04f981d3ce6ce6db7ebafd12e513.png

numElements 表示元素个数,初始分配的空间会至少容纳这么多元素,但空间不是正好 numElements 这么大。 ArrayDeque 实现了 Deque 接口,同 LinkedList 一样,它的队列长度也是没有限制的, Deque 扩展了 Queue ,有队列的所有方法,还可以看作栈,有栈的基本方法 push/pop/peek ,此外还包括操作两端的方法如 addFirst/removeLast 等,具体的使用用法与 LinkedList 类似,我们就不再做过多的讲解了。

2.实现原理数据存储单元

ArrayDeque 内部主要有如下的实例变量:

ed58b0b88fab0806765d57de01b26549.png

elements 就是存储元素的数组。 ArrayDeque 的高效来源于 head 和 tail 这两个变量,它们使得物理上简单的从头到尾的数组变为了一个逻辑上循环的数组,避免了在头尾操作时的移动操作。从数据存储单元可以看出,他的结构和ArrayList类似,都是使用了数组,那么我们可以猜测他的随机访问和队尾添加数据元素与队尾删除数据元素效率会和ArrayList一样高。那么接下来我们一起分析一下这颗明珠的内核原理。

2.1 循环数组

对于一般数组,比如 arr ,第一个元素为 arr[0] ,最后一个为 arr[arr.length - 1] 。但对于 ArrayDeque 中的数组,它是一个逻辑上的循环数组,所谓循环是指元素到数组尾之后可以接着从数组头开始,数组的长度、第一个和最后一个元素都与 head 和 tail 这两个变量有关,其具体实现为:

如果 head 和 tail 相同,则数组为空,长度为 0 。

410198efde82597c2da55eb3dc5cc5e5.png

如果 tail 大于 head ,则第一个元素为 elements[head] ,最后一个为 elements[tail - 1] ,长度为 tail-head ,元素索引从 head 到 tail - 1 。

9c3c48e4f6c29bdb38e11e697fe9725d.png

如果 tail 小于 head ,且为0,则第一个元素为 elements[head] ,最后一个为 elements[elements.length - 1],元素索引从 head 到 elements.length - 1。

9d3dced1530e3af7587ec338ceacce12.png

如果 tail 小于 head ,且大于0,则会形成循环,第一个元素为 elements[head] ,最后一个是 elements[tail - 1],元素索引从 head 到 elements.length - 1,然后再从 0 到 tail - 1 。

c080d409345d6a23d41444016d3bc424.png

2.2 构造函数

0f6f9f92d28043a077f5690f683097e4.png

无参数的构造函数分配了一个长度为 16 的数组。

有参数的构造函数调用了 allocateElements(numElements) 方法,其核心逻辑为:

如果 numElements 小于 8,其分配的数组长度就是 8 。

如果 numElements 大于等于 8 ,分配的实际长度是基于 numElements 计算出的最接近的一个 2^n 数。例如 numElements 为 10 ,则实际分配的长度为 2^4 = 16 ,如果 numElements 为 32 ,则实际分配长度为: 2^6 = 64 。

2.3 为什么要分配的实际长度必须要大于 numElements ?

因为循环数组必须至少留出一个空余的位置, tail 变量指向下一个空位,为了容纳 numElements 个元素,至少需要 numElements + 1 个位置。

除了上述两个构造函数之外, ArrayDeque 还有一个构造方法:

9ec01d220f23d6c08133ecbe855bfaf8.png

同样调用 allocateElements 分配数组,随后调用了 addAll ,而 addAll 只是循环调用了 add 方法。

2.4 从尾部添加元素 add

5eb59e34add447e38ba0852823bff43a.png

首先将元素添加到 tail 处,然后 tail 指向下一个位置,即 tail = (tail + 1) & (elements.length - 1),如果与 head 相同,说明队列满了,会调用 doubleCapacity 扩展数组。

这里重点解释一下 tail = (tail + 1) & (elements.length - 1) 代码的原理:

tai + 1 与 elements.length - 1 的 位与 操作就可以得到下一个元素的位置,原因是 elements.length 是 2 的冥次方,而 elements.length - 1 的后几位全都是 1 。例如,elements.length - 1 = 7 ,二进制为 0111 。

e37ec2050bcc6f7432c115e2add1ac5b.png

上面两个 位与 操作都能够正确找出循环数组中下一个元素的位置。这种位操作是循环数组中一种常见的操作,效率非常高。

2.5 为什么分配的实际长度是基于 numElements 计算出的最接近的一个 2^n 数 ?

前面我们在讲解构造函数时,我们提到了上面的这个规则,但是没有讲解其原因,学习到这里我们应该明白了,为了支持上述的高效的 位与 操作从而得到下一个元素的位置,因此必须要确保 elements.length 是 2 的冥次方。

doubleCapacity() 方法将数组扩大为两倍,分配一个长度翻倍的新数组 a ,将 head 右边的元素复制到新数组开头处,再复制左边的元素到新数组中,最后重新设置 head 和 tail ,head 设为 0 , tail 设为 n :

我们来看一个例子,假设原长度为 8 , head 和 tail 为 4 ,现在开始扩大数组,扩大前后的结构如下所示:

7e1ba51358d8b49eea6fa458b6442f1f.png

2.6 从头部添加元素 addFirst

9ab60e6362d593c5dc14f855559e82a6.png

在头部添加,要先让 head 指向前一个位置,然后再赋值给 head 所在位置。 head 的前一个位置是(head - 1) & (elements.length - 1)。刚开始 head 为 0 ,如果 elements.length 为 8 ,则结果为 位与 操作为 7 。

比如如下的代码执行:

2c289241bee73dd8fd6f01c7303d0995.png

执行完了之后其内部结构为:

7e9d8f3c2104b69d421d7ff58f21371b.png

2.7 从头部删除元素 removeFirst

9e3f49a23002caf89630b5a8de329d46.png

将原头部位置置为 null ,然后 head 置为下一个位置,下一个位置为 (h + 1) & (elements.length - 1) 。

2.8 查看长度 size

cb9baf5b0ec5edea94c2e8490402a358.png

2.9 检查元素是否存在 contains

1a28a1f3719a48091a467c5f25adbd44.png

从 head 开始遍历并进行对比,循环过程中没有使用 tail ,而是到元素为 null 就结束了,这是因为在 ArrayDeque 中,有效元素不允许为 null 。

ArrayDeque 的复杂度分析以及应用场景

ArrayDeque 实现了双端队列,内部使用动态扩展的循环数组实现,通过 head 和 tail 变量维护数组的开始和结尾,数组长度为2的幂次方,使用高效的位操作进行各种判断,以及对 head 和 tail 进行维护。其特点为:

在两端添加、删除元素的效率很高,但是由于支持动态扩展,会产生额外的内存分配以及数组复制开销,因此,添加 N 个元素的复杂度为 O(N) 。

根据元素内容查找效率比较低,为 O(N) 。

与 LinkedList 不同,没有索引位置的概念,不能根据索引位置进行操作;由于没有索引位置的概念,同样也无法支持从指定的位置 insert or remove 一个元素。

ArrayDeque 和 LinkedList 都实现了Deque接口,应该用哪一个呢?如果只需要 Deque 接口,从两端进行操作,一般而言,ArrayDeque 效率更高一些,应该被优先使用;如果同时需要根据索引位置进行操作,或者经常需要在中间进行插入和删除,则应该选择 LinkedList 。

cb1eec756942eaeffc388bed126066e9.png