再思考Java里的数据结构容器——hash容器：hashset hashmap hash容器的结构

lorry1113

浏览: 268605 次
性别:
来自: 北京

最近访客更多访客>>

jack6wolf

javakf

孤山君

霜落天涯

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

数据结构 Java 编程设计模式

Hashtable跟hashmap差不多，不过HashTable强制同步，是线程安全的。

HashSet<E>是通过内置的HashMap<E,object>来实现的，HashSet<E>中指定的元素类型E，本身就是key，每个元素的value是一个常量object，HashSet仅作一个集合管理，只有add contains remove等接口，没有get接口。

重点讨论下HashMap的结构。

HashMap维护了capacity个数的hash bucket(hash桶)，这个是用数组实现的，即table[capacity]，每个非空的hash bucket其实是一个映射链表的表头，即list head of entry，链表里面的每个entry负责一个具体key到value的映射。

每个hash bucket里元素，他们key值的hashcode可能不一样，即hash散列时是容许冲突的，但一样的是hashcode&(capacity-1)，这个hashcode&(capacity-1)即他们所在的hash bucket在table[capacity]里的index，其实这就是hash散列的过程，顺便说下这个hashcode是key的hashcode经过变换之后得到的，这个index就是所谓的hash bucket index。

当然capacity也可以认为是元素的容量，因为理想的hash散列是一对一的，即没有散列冲突，一个hash bucket固定存储一个key到value的映射，后面可以看到容器维护的时候也是这么努力的，是否扩充容量是由元素的个数是否到了负载极限来决定的，而不是已填充的hash bucket的个数，这是表现之一。

有了这个概念之后再看hashmap的常见操作：

为一个元素在table[bucketIndex]里添加一个映射entry，如果超过threshold(Capacity * loadFactor),则扩展一倍，默认的容量是16，loderfactor是0.75，所以当元素个数达到12的时候，table容量扩充为32，依次64，128等

    void addEntry(int hash, K key, V value, int bucketIndex) {

Entry<K,V> e = table[bucketIndex]; // 获取hash bucket里的entry链表表头
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
// new Entry<K,V>(hash, key, value, e) 构造里是这么写的：this.next = e,可见是前插法填充链表的。
        if (size++ >= threshold)
            resize(2 * table.length);
    }

查找是否包含某个key的映射：比如 hm.add("ab");则hm.containsKey("ab")则true

    public boolean containsKey(Object key) {
//空元素null特殊对待，貌似专门用一个object常量
        Object k = maskNull(key);
//把k的hashcode再转换
        int hash = hash(k);
//hashcode&(capacity-1)换的index
        int i = indexFor(hash, table.length);
        Entry e = table[i];
// 在entry链表里找key
        while (e != null) {
//先验证key的hashcode，然后就是key的equals值
            if (e.hash == hash && eq(k, e.key))
                return true;
            e = e.next;
        }
        return false;
    }

按照这个过程分析hm.containsKey("ab")，过程就是通过"ab"的hashcode值找到hashbucket的entry链表表头，然后在里面逐个与"ab"比较equals，找到的话则返回true，否则false。其他的查找操作与这个过程大同小异，比如get(key);put(key,value)其实也有个类似的查找映射enty的操作。

    public V put(K key, V value) {
K k = maskNull(key);
        int hash = hash(k);
        int i = indexFor(hash, table.length);

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            if (e.hash == hash && eq(k, e.key)) {
//put另一个值得注意的地方：同一个key下增加，会把原来的value给覆盖掉
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(hash, k, value, i);
        return null;
    }

同样如果是查找某个value，得依次遍历所有的hash bucket，并逐个与给定值进行equals，这个源码略去。

原创，转载请标注http://hi.baidu.com/heelenyc 欢迎交流指正。

再看hashtable。
大致上和hashmap是一样的，但可以肯定他们两不是一个人写的，实现细节有差别，包括hash散列函数，空值处理、代码风格等。
最重要的区别是在关键操作方法前多了一个synchronized同步的，这是出于线程安全而考虑的。下面以put函数为例

    public synchronized V put(K key, V value) {
// Make sure the value is not null
//从这可以看出 hashtable不欢迎value==null的元素，hashmap对这个问题专门对待

if (value == null) {
     throw new NullPointerException();
}

// Makes sure the key is not already in the hashtable.
Entry tab[] = table;
//此处如果key为null，抛出异常
int hash = key.hashCode();
//跟hashmap的散列函数有区别
int index = (hash & 0x7FFFFFFF) % tab.length;
for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
     if ((e.hash == hash) && e.key.equals(key)) {
   V old = e.value;
   e.value = value;
   return old;
     }
}

总结：
1、HashSet,HashMap,Hashtable 之所以"hash", 个人认为体现在：
首先、通过key的hashcde找到table[capability]里的hash bucket的过程，这是hash散列的过程，
其次、散列过程显然无法避免冲突，在元素个数不止一个的hash bucket通过链表查找key的过程，其实就是hash再探测的过程，显然java是通过链表来解决hash冲突的。

2、key的hashcode、key的equals方法和value的equals方法是hash容器操作的关键，所以当我们自定义hash容器的元素类的时候，特别要注意这两个方法的重写。用到的地方包括：
查找key是用key的hashcode找hash bucket，用key的equals找对应的entry；查找value是使用了value的equals来匹配的。

3、Hashtable和Hashmap在hash处理上大同小异，列举几点
区别一：hashtable不允许null的value，也没有考虑null的key，即在获取key的hashcode会抛出异常，hashmap碰到null的key都替换成一个常量object，它也可以容忍null的value
区别二：把key的hashcode散列到hash bucket的时候有区别
区别三：Hashtable强制同步，保证线程安全。

原创，转载请标注http://hi.baidu.com/heelenyc 欢迎交流指正。

待续，下次看下容器里的泛型编程和设计模式。

分享到：

java数据结构内容整理 | oracle存储过程,游标及循环应用实例

2010-07-21 14:56
浏览 1518
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

实训商业源码-付费进群自动定位版本-毕业设计.zip: 实训商业源码-付费进群自动定位版本-毕业设计.zip

单级热电制冷器件，全球前20强生产商排名及市场份额（by QYResearch）.pdf: 单级热电制冷器件，全球前20强生产商排名及市场份额（by QYResearch）.pdf

实训商业源码-Turbo Website Reviewer SEO分析报告工具源码-毕业设计.zip: 实训商业源码-Turbo Website Reviewer SEO分析报告工具源码-毕业设计.zip

COMSOL模拟铌酸锂波导倍频PPLN技术解析及实操经验分享: 内容概要：本文详细介绍了利用COMSOL进行铌酸锂波导倍频(PPLN)仿真的方法和技术难点。首先讨论了材料设置中非线性系数d33的空间调制方式，推荐使用tanh函数代替sign函数以提高收敛性。接着阐述了波导结构的选择和模式分析的关键步骤，强调了正确设置边界条件的重要性。对于网格划分提出了在极化周期交界处局部加密的方法，并解释了分步求解策略以节省内存。最后，作者提醒注意相位匹配条件以及考虑实际器件制造中的工艺误差对转换效率的影响。适合人群：从事非线性光学研究、光子学器件设计的研究人员和工程师。使用场景及目标：帮助读者掌握COMSOL软件中针对PPLN结构的仿真技巧，优化仿真流程，提升仿真准确性，解决实际项目中可能遇到的问题。阅读建议：由于文中涉及大量具体的操作细节和技术要点，建议读者结合自己的项目背景仔细研读每个部分的内容，并尝试将所学应用到实践中去。

PLOT2222222222: PLOT2222222222

新能源领域的技术创新：19永磁直驱风机+混合储能+PQ逆变并网系统: 内容概要：本文介绍了“19永磁直驱风机+混合储能+PQ逆变并网”系统，这是一种集成永磁直驱风机、混合储能设备和PQ逆变器的综合性解决方案，旨在实现可再生能源的高效利用和电网的稳定并网。文中详细阐述了各组件的工作原理及其协同效应，强调了该系统在提高能量转换效率、增强电网稳定性和改善供电质量方面的优势。通过对实际应用效果的分析，展示了该系统在低风速环境下的稳定输出能力、混合储能系统的削峰填谷作用以及PQ逆变器的智能调控和保护功能。适合人群：从事新能源研究和技术开发的专业人士，关注绿色能源发展的科研工作者和政策制定者。使用场景及目标：适用于风电场建设、分布式能源系统规划等领域，旨在推动可再生能源的广泛应用，促进电网的智能化和稳定性。其他说明：随着可再生能源的发展，该系统有望在全球范围内获得更广泛的应用，成为未来能源领域的重要组成部分。

商用车P2并联混合动力系统HCU控制策略解析与建模指南: 内容概要：本文详细介绍了商用车P2并联混合动力系统的HCU（整车控制器）控制策略及其建模方法。首先探讨了模式切换策略，针对不同工况如车辆速度、电池电量等因素进行模式选择。接着深入讲解了扭矩分配策略，考虑到了温度变化以及坡道情况对扭矩分配的影响。此外，还讨论了能量回收策略，利用预测性制动提高能量利用率。最后提及了故障降级策略，确保系统在出现故障时能够快速响应。文中提供了多个具体代码片段来辅助理解和实施这些策略。适合人群：从事汽车电子控制系统开发的技术人员，尤其是专注于混合动力系统的研究人员和工程师。使用场景及目标：帮助开发者将理论性的功能规范转化为实际可用的控制模型，适用于商用车P2并联混合动力系统的开发过程中，旨在提升系统的效率和平顺性。其他说明：建议读者在实践中不断调整和完善模型参数，以适应不同的应用场景和技术要求。同时，在构建模型时应注意保持良好的可追溯性和验证性，以便后续维护和改进。

openai-agents-python-AI人工智能资源: OpenAI Agents SDK

干式无油螺杆空压机，2024年前13大企业占据全球78%的市场份额.pdf: 干式无油螺杆空压机，2024年前13大企业占据全球78%的市场份额.pdf

实训商业源码-多功能水果外卖电子商务手机模板-毕业设计.zip: 实训商业源码-多功能水果外卖电子商务手机模板-毕业设计.zip

.NET Framework 3.5(Windows server系统）: .NET Framework 3.5(Windows server系统）

全国大学生电子设计竞赛的预测.pdf: 电子设计竞赛相关资源

电子设计竞赛论文要点.pdf: 电子设计竞赛相关资源

膜用聚砜，全球前9强生产商排名及市场份额（by QYResearch）.pdf: 膜用聚砜，全球前9强生产商排名及市场份额（by QYResearch）.pdf

信號完整性小技巧 #2 EYE CONTOUR.pdf: 信號完整性小技巧 #2 EYE CONTOUR.pdf

常规S参数与共模差模S参数转换.pdf: 常规S参数与共模差模S参数转换

实训商业源码-UNIAPP开发的软件市场多端源码-毕业设计.zip: 实训商业源码-UNIAPP开发的软件市场多端源码-毕业设计.zip

振动与噪声分析领域中LMS系统的模态分析与锤击实验实践指南: 内容概要：本文详细介绍了LMS（LabVIEW Multifunctional System）测试系统在模态分析和锤击实验中的应用。首先解释了LMS系统及其核心功能——模态分析，这是一种用于确定结构振动特性的关键技术，可以获取固有频率、阻尼比和模态形状等参数。接着阐述了锤击实验的具体步骤，包括实验准备、数据采集、激励与响应记录、数据分析和结果解读。文中还简要介绍了LMS系统中使用的软件工具，涵盖数据导入、滤波与去噪、频域分析、模态识别与提取等功能。最后强调了模态分析和锤击实验在结构设计、优化和故障诊断中的重要作用。适合人群：从事机械工程、振动与噪声分析的技术人员，尤其是需要掌握模态分析和锤击实验的应用工程师。使用场景及目标：适用于希望深入了解LMS系统在模态分析和锤击实验中的具体应用，提升结构设计和故障诊断能力的专业人士。目标是在实际工作中更好地利用LMS系统进行振动与噪声分析。其他说明：本文不仅提供了理论知识，还详细描述了实验操作流程，帮助读者更好地理解和应用相关技术。

MATLAB 2021b深度学习入门：手写数字图像识别与CNN特征提取: 内容概要：本文详细介绍了使用MATLAB 2021b进行手写数字图像识别的深度学习入门教程。主要内容涵盖从加载MNIST数据集到构建并训练卷积神经网络(CNN)的全过程。首先展示了如何读取和预览数据集，接着逐步讲解了CNN各层的设计思路及其功能，如卷积层、批规范化层、ReLU激活函数以及池化层的作用。随后，演示了如何将数据集划分为训练集和验证集，并设置训练选项来启动模型训练。此外，还提供了提取和展示中间层特征图的方法，帮助理解CNN的工作机制。最后，评估了模型性能并通过混淆矩阵直观地展示了分类效果。适合人群：初学者和希望快速掌握MATLAB环境下深度学习应用的研究人员或学生。使用场景及目标：适用于希望通过实际操作加深对深度学习理论和技术的理解，特别是对于想要了解CNN架构及其在图像识别任务中具体应用的人群。其他说明：文中提供的代码片段可以直接在MATLAB环境中执行，便于读者跟随教程动手实践。同时，强调了模型训练过程中需要注意的问题，如过拟合现象的监控等。

博世汽车电驱仿真模型：同步与异步电机的FOC控制及优化技术: 内容概要：本文详细介绍了博世汽车电驱仿真模型的技术细节，涵盖同步电机和异步电机的相电流波形优化、自动弱磁FOC控制、正反转切换电流稳定性和铁损计算等方面。文中展示了MATLAB和C语言编写的自动化控制脚本，以及Python编写的高效铁损计算方法。特别强调了在高转速条件下保持电流波形的稳定性，以及通过动态磁滞模型提高铁损计算精度。适合人群：从事电动汽车驱动系统研究的专业人士、电机控制系统工程师和技术研究人员。使用场景及目标：适用于需要深入了解和应用先进电机控制技术和仿真的场合，如电动汽车动力系统的开发和测试。目标是掌握先进的FOC控制算法和优化技术，提高电机性能和效率。其他说明：文章不仅提供了理论背景，还包括具体的实现代码片段，便于读者理解和实际操作。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论