面试官:"准备用HashMap存1w条数据,构造时传10000还会触发扩容吗?"

  • 时间:
  • 浏览:1
  • 来源:极速快3_快3官网ios版_极速快3官网ios版

// 预计存入 1w 条数据,初始化赋值 20000,防止 resize。
HashMap<String,String> map = new HashMap<>(20000)
// for (int i = 0; i < 20000; i++)

Java 集合的扩容

HashMap 有无一群人一群人一群人一群人最常用的集合之一,人太好 对于 Android 开发者,Google 官方推荐了更省内存的 SparseArray 和 ArrayMap,一点 HashMap 依然是最常用的。

一群人一群人一群人一群人通过 HashMap 来存储 Key-Value 你这个 键值对形式的数据,其组织组织结构通过哈希表,让存取下行速度 最好时不上能 达到 O(1),而又将会将会所处的 Hash 冲突,引入了链表和红黑树的底部形态,让下行速度 最差也差不过 O(logn)。

整体来说,HashMap 作为一款工业级的哈希表底部形态,下行速度 还是有保障的。

编程语言提供的集合类,人太好 底层还是基于数组、链表你这个 最基本的数据底部形态,一点和一群人一群人一群人一群人直接使用数组不同,集合在容量不足英文时,会触发动态扩容来保证有足够的空间存储数据

动态扩容,涉及到数据的拷贝,是某种生活「较重」的操作。那将会不用上能 提前选折 集合将要存储的数据量范围,就不上能 通过构造方法,指定集合的初始容量,来保证接下来的操作中,不至于触发动态扩容。

这就引入了本文开篇的什么的什么的问题 ,将会使用 HashMap,当初始化是构造函数指定 1w 时,后续一群人一群人一群人一群人立即存入 1w 条数据,有无符合与其不用触发扩容呢?

在分析你这个 什么的什么的问题 前,一点们先来看看,HashMap 初始化时,指定初始容量值都做了那先 ?

PS:本文所涉及代码,均以 JDK 1.8 中 HashMap 的源码举例。

HashMap 的初始化

在 HashMap 中,提供了另1个 指定初始容量的构造方法 HashMap(int initialCapacity),你这个 方法最终会调用到 HashMap 一点构造方法,其中的参数 loadFactor 一点默认值 0.75f。

public HashMap(int initialCapacity, float loadFactor) {
  if (initialCapacity < 0)
    throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
  if (initialCapacity > MAXIMUM_CAPACITY)
    initialCapacity = MAXIMUM_CAPACITY;
  if (loadFactor <= 0 || Float.isNaN(loadFactor))
    throw new IllegalArgumentException("Illegal load factor: " + loadFactor);

  this.loadFactor = loadFactor;
  this.threshold = tableSizeFor(initialCapacity);
}

其中的成员变量 threshold 一点用来存储,触发 HashMap 扩容的阈值,也一点说,当 HashMap 存储的数据量达到 threshold 时,就会触发扩容。

从构造方法的逻辑不上能 看出,HashMap 并全部后要 直接使用组织组织结构传递进来的 initialCapacity,一点经过了 tableSizeFor() 方法的防止,再赋值到 threshole 上。

static final int tableSizeFor(int cap) {
  int n = cap - 1;
  n |= n >>> 1;
  n |= n >>> 2;
  n |= n >>> 4;
  n |= n >>> 8;
  n |= n >>> 16;
  return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

tableSizeFor() 方法中,通过逐步位运算,就不上能 让返回值,保持在 2 的 N 次幂。以方便在扩容的然后 ,快速计算数据在扩容后的新表中的位置。

没人一群人一群人一群人一群人一群人一群人从组织组织结构传递进来 1w 时,实际上经过 tableSizeFor() 方法防止然后 ,就会变成 2 的 14 次幂 16384,再算上负载因子 0.75f,实际在不触发扩容的前提下,可存储的数据容量是 12288(16384 * 0.75f)。

你这个 场景下,用来存放 1w 条数据,绰绰有余了,无须会触发一群人一群人一群人一群人猜想的扩容。

HashMap 的 table 初始化

一群人一群人一群人一群人一群人一群人把初始容量,调整到 2000 时,情况表又不一样了,情况表表具体分析。

再回到 HashMap 的构造方法,threshold 为扩容的阈值,在构造方法中由 tableSizeFor() 方法调整后直接赋值,太久太久太久太久有在构造 HashMap 时,将会传递 2000,threshold 调整后的值人太好 是 1024,但 HashMap 无须直接使用它。

仔细想想就会知道,初始化时决定了 threshold 值,但其装载因子(loadFactor)并没人参与运算,那在顶端具体逻辑的然后 ,HashMap 是咋样防止的呢?

在 HashMap 中,所有的数据,全部后要 通过成员变量 table 数组来存储的,在 JDK 1.7 和 1.8 中人太好 table 的类型有所不同,一点数组你这个 基本底部形态并没人变化。没人 table、threshold、loadFactor 三者之间的关系,一点:

table.size == threshold * loadFactor

那你这个 table 是在那先 然后 初始化的呢?这就要说会到一群人一群人一群人一群人老会 在回避的什么的什么的问题 ,HashMap 的扩容。

在 HashMap 中,动态扩容的逻辑在 resize() 方法中。你这个 方法不仅仅承担了 table 的扩容,它还承担了 table 的初始化。

一群人一群人一群人一群人一群人一群人首次调用 HashMap 的 put() 方法存数据时,将会发现 table 为 null,则会调用 resize() 去初始化 table,具体逻辑在 putVal() 方法中。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length; // 调用 resize()
    // ...
}

resize() 方法中,调整了最终 threshold 值,以及完成了 table 的初始化。

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; 
    }
    else if (oldThr > 0) 
        newCap = oldThr; // ①
    else {               
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    if (newThr == 0) {
        // ②
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr; // ③
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab; // ④
    // ....
}

注意看代码中的注释标记。

将会 resize() 还糅合了动态扩容的逻辑,太久太久太久太久有我将初始化 table 的逻辑用注释标记出来了。其中 xxxCap 和 xxxThr 分别对应了 table 的容量和动态扩容的阈值,太久太久太久太久有所处旧和新两组数据。

一群人一群人一群人一群人一群人一群人指定了初始容量,且 table 未被初始化时,oldThr 就不为 0,则会走到代码 的逻辑。在其中将 newCap 赋值为 oldThr,也一点新创建的 table 会是一群人一群人一群人一群人构造的 HashMap 时指定的容量值。

然后 要 进入代码 的逻辑,其中就通过装载因子(loadFactor)调整了新的阈值(newThr),当然这里也做了一点限制需用让 newThr 在另1个 合法的范围内。

在代码 中,将使用 loadFactor 调整后的阈值,重新保存到 threshold 中。并通过 newCap 创建新的数组,将其指定到 table 上,完成 table 的初始化(代码 )。

到这里也就清楚了,人太好 一群人一群人一群人一群人在初始化时,传递进来的 initialCapacity 人太好 被赋值给 threshold,一点它实际是 table 的尺寸,一点最终会通过 loadFactor 重新调整 threshold

没人回到然后 的什么的什么的问题 全部后要 答案了,人太好 HashMap 初始容量指定为 2000,一点它一点表示 table 数组为 2000,扩容的重要方法扩容阈值会在 resize() 中调整为 768(1024 * 0.75)。

它是不足英文以承载 2000 条数据的,最终在存够 1k 条数据然后 ,后要 触发一次动态扩容。

通常在初始化 HashMap 时,初始容量全部后要 根据业务来的,而不用是另1个 固定值,为此一群人一群人一群人一群人需用另1个 特殊防止的方法,一点将预期的初始容量,再除以 HashMap 的装载因子,默认时一点除以 0.75。

类似于于你要用 HashMap 存放 1k 条数据,应该设置 2000 / 0.75,实际传递进去的值是 1333,然后 要 被 tableSizeFor() 方法调整到 2048,足够存储数据而不用触发扩容。

当想用 HashMap 存放 1w 条数据时,依然设置 20000 / 0.75,实际传递进去的值是 13333,会被调整到 16384,和一群人一群人一群人一群人直接传递 20000 效果是一样的。

小结时刻

到这里,就了解清楚了 HashMap 的初始容量,应该咋样科学的计算,本质上你传递进去的值将会并无法直接存储没人多数据,会另1个 动态调整的过程。其中就需用将一群人一群人一群人一群人预期的值进行放大,比较科学的一点方法装载因子进行放大。

最后一群人一群人一群人一群人再总结一下:

  1. HashMap 构造方法传递的 initialCapacity,人太好 在防止后被存入了 loadFactor 中,但它实际表示 table 的容量。
  2. 构造方法传递的 initialCapacity,最终会被 tableSizeFor() 方法动态调整为 2 的 N 次幂,以方便在扩容的然后 ,计算数据在 newTable 中的位置。
  3. 将会设置了 table 的初始容量,会在初始化 table 时,将扩容阈值 threshold 重新调整为 table.size * loadFactor。
  4. HashMap 有无扩容,由 threshold 决定,而 threshold 又由初始容量和 loadFactor 决定。
  5. 将会一群人一群人一群人一群人预先知道 HashMap 数据量范围,不上能 预设 HashMap 的容量值来提升下行速度 ,一点需用注意要考虑装载因子的影响,不上能 保证不用触发预期之外的动态扩容。

HashMap 作为 Java 最常用的集合之一,市面上优秀的文章太久太久太久太久有,一点很少一群人从初始容量的宽度来分析其中的逻辑,而初始容量又是集合中比较实际的优化点。人太好 不少人也搞不清楚,在设置 HashMap 初始容量时,有无应该考虑装载因子,才有了此文。

将会本文对你有所帮助,留言、转发、点好看是最大的支持,谢谢!


公众号后台回复成长『成长』,将会得到我准备的学习资料,不上能 回复『加群』,一齐学习进步。