HashMap和HashTable的区别和不同转载总结

zlk

浏览: 229742 次
性别:
来自: 北京

最近访客更多访客>>

dunhanson

wlyp4

yongmeixin

baiwei_yf

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

学习文章

面试咨询多线程 Windows 数据结构

Hashtable和HashMap类有三个重要的不同之处。第一个不同主要是历史原因。Hashtable是基于陈旧的Dictionary类的，HashMap是Java 1.2引进的Map接口的一个实现。
　　
　　也许最重要的不同是Hashtable的方法是同步的，而HashMap的方法不是。这就意味着，虽然你可以不用采取任何特殊的行为就可以在一个多线程的应用程序中用一个Hashtable，但你必须同样地为一个HashMap提供外同步。一个方便的方法就是利用Collections类的静态的synchronizedMap()方法，它创建一个线程安全的Map对象，并把它作为一个封装的对象来返回。这个对象的方法可以让你同步访问潜在的HashMap。这么做的结果就是当你不需要同步时，你不能切断Hashtable中的同步（比如在一个单线程的应用程序中），而且同步增加了很多处理费用。
　　
　　第三点不同是，只有HashMap可以让你将空值作为一个表的条目的key或value。HashMap中只有一条记录可以是一个空的key，但任意数量的条目可以是空的value。这就是说，如果在表中没有发现搜索键，或者如果发现了搜索键，但它是一个空的值，那么get()将返回null。如果有必要，用containKey()方法来区别这两种情况。
　　
　　一些资料建议，当需要同步时，用Hashtable，反之用HashMap。但是，因为在需要时，HashMap可以被同步，HashMap的功能比Hashtable的功能更多，而且它不是基于一个陈旧的类的，所以有人认为，在各种情况下，HashMap都优先于Hashtable。
　　
　　关于Properties
　　有时侯，你可能想用一个hashtable来映射key的字符串到value的字符串。DOS、Windows和Unix中的环境字符串就有一些例子，如key的字符串PATH被映射到value的字符串C:\WINDOWS;C:\WINDOWS\SYSTEM。Hashtables是表示这些的一个简单的方法，但Java提供了另外一种方法。
　　
　　Java.util.Properties类是Hashtable的一个子类，设计用于String keys和values。Properties对象的用法同Hashtable的用法相象，但是类增加了两个节省时间的方法，你应该知道。
　　
　　Store()方法把一个Properties对象的内容以一种可读的形式保存到一个文件中。Load()方法正好相反，用来读取文件，并设定Properties对象来包含keys和values。
　　
　　注意，因为Properties扩展了Hashtable，你可以用超类的put()方法来添加不是String对象的keys和values。这是不可取的。另外，如果你将store()用于一个不包含String对象的Properties对象，store()将失败。作为put()和get()的替代，你应该用setProperty()和getProperty()，它们用String参数。
　　
　　好了，我希望你现在可以知道如何用hashtables来加速你的处理了。

文章来自：http://zhidao.baidu.com/question/5458097.html?fr=ala0

记得刚毕业那会准备面试，看过不少面试题，里面有个说出HashMap和HashTable不同的题目，我那会面试的时候也遇到不少次这个问题，还隐约记得当时的回答是这样的：
HashTable是比较旧的版本；HashTable是线程安全的，而HashMap是非线程安全的；HashMap的key和value允许Null值，还有就是HashMap效率要高。好像就这些了吧，当时认识也比较肤浅。

前段时间有空就想起来了这个问题，于是就想深入的理解一下这两个比较常用的数据结构，然后看了一下这两个类的源码，有了比以前更深入的了解。大体上这两个类内部处理差别不是很大，当然还是有不少不同，下面我们来一一探讨一下他们之间的不同
引言：首先来说一下HashMap内部其实是一个数组+链表的结构，当你put一个元素的时候，HashMap会根据Key的hash值算出要存放的数组的位置，如果两个元素算出的数组值相同的话，那么他们会放在数组里的同一个位置，这个时候在获取该元素的时候，那么会根据Key的hash找到数组的位置，然后再从链表中找到该元素。那么我们可以很容易的想象到，如果每一个数组里只有一个元素的时候，效率是最高的，因为不需要再对链表进行操作。有了这点认识我们就可以进行接下来的分析了。

[list]
[1]数组大小。
既然说了内部是数组+链表，那就设计到数组的大小，这一点，HashMap和HashTable是不同的
HashMap的默认大小

Java代码
static final int DEFAULT_INITIAL_CAPACITY = 16 ;
static final int DEFAULT_INITIAL_CAPACITY = 16;

我们看到默认是16，而且HashMap的大小一定是2的幂数。这里你可能会问了，如果初始化HashMap的时候指定了一个不是2的幂数的长度呢？如果是这种情况，它也会找到一个最接近你指定值的一个2的幂数，下面是源码：

Java代码
int capacity = 1 ;
        while (capacity < initialCapacity)
            capacity <<= 1 ;
int capacity = 1;
        while (capacity < initialCapacity)
            capacity <<= 1;

就是他会找到一个比你指定值大且是2的幂数的一个值，那么为什么它会这么做呢，这个问题我留到下面具体说明。
HashMap长度最大值也是有设定的，他的最大值是

Java代码
static final int MAXIMUM_CAPACITY = 1 << 30 ;
static final int MAXIMUM_CAPACITY = 1 << 30;

如果你指定超过这个大小，它会抛弃你指定的值而采用这个默认值

Java代码
if (initialCapacity > MAXIMUM_CAPACITY)
           initialCapacity = MAXIMUM_CAPACITY;
if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;

HashTable的默认大小

Java代码
public Hashtable() {
    this ( 11 , 0 .75f);
    }
public Hashtable() {
this(11, 0.75f);
    }

默认是11，HashTable跟HashMap不同如果你指定了长度，它不会对你的指定值进行处理。HashTable的最大值，我没看有看到HashTable中有指定最大值的行为

[2]长度扩容
上面我们讲了两个类的初始大小，这里需要说明的事，在实际中真正利用的长度并不是这个值，而是有个加载因子，默认是0.75，比如长度是16，而真正使用的是16*0.75，当超过这个数，就会扩容
HashMap扩容
HashMap扩容会把之前长度*2，因为之前的长度肯定是2的幂数，所以自动扩容后也是2的幂数

HashTable扩容
HashTable扩容是把之前长度*2+1

扩容操作是比较消耗资源的，所以这里我们告诉我们在初始化HashMap和HashTable的时候要考虑到实际使用时的长度，应该尽可能的避免出现扩容的操作，从而提高效率

[3]put操作
HashMap的put

Java代码
public V put(K key, V value) {
    K k = maskNull(key);
        int hash = hash(k);
        int i = indexFor(hash, table.length);

        for (Entry<K,V> e = table[i]; e != null ; e = e.next) {
            if (e.hash == hash && eq(k, e.key)) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this );
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, k, value, i);
        return   null ;
    }
public V put(K key, V value) {
K k = maskNull(key);
        int hash = hash(k);
        int i = indexFor(hash, table.length);

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            if (e.hash == hash && eq(k, e.key)) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, k, value, i);
        return null;
    }

我们看到首先进行maskNull，这也是为什么HashMap允许有null键；
然后是计算hash值，下面是hash方法

Java代码
static   int hash(Object x) {
        int h = x.hashCode();

        h += ~(h << 9 );
        h ^= (h >>> 14 );
        h += (h << 4 );
        h ^= (h >>> 10 );
        return h;
    }
static int hash(Object x) {
        int h = x.hashCode();

        h += ~(h << 9);
        h ^= (h >>> 14);
        h += (h << 4);
        h ^= (h >>> 10);
        return h;
    }
这里HashMap对hash值进行处理，进行了一些列的操作，目的是为了让hash值的高位参与接下来的运算，至于为什么要用到 9，14，4，10这几个数，我也不明白，我曾经给JDK的作者之一道格发过邮件咨询这个问题，他没有给我正面的回答，而是建议我看一本书中的hash那一章节，在我查找该问题的时候，发现国外很多人也向道格咨询过此问题，得到的回到好像跟我得到的回答是一样的，嘿嘿。好了，不说题外话了，反正大家知道经过这么操作我们到了一个非负整数。接下来是计算数组下标indexFor

Java代码
static   int indexFor( int h, int length) {
        return h & (length- 1 );
    }
static int indexFor(int h, int length) {
        return h & (length-1);
    }

这里的 h & (length-1)是比较出彩的地方，也是为什么前面我们介绍HashMap长度的时候，他总是2的幂数，现在我们知道为什么了吧，它实现了 h & (length-1)等价于h % length的操作，求与比求模效率要高，在道格给我的回信中也提到了这一点。也许有人会问了，这里求与的操作中hash的高位没有参与到运算，那么当 hash值高位不同时，算出的index却是相同的，那么也就是说增加了在数组中相同位置存放的对象的几率，sun其实考虑到这个问题了，这就是我前面提到的那个hash方法，这也是我向道格发邮件的原因。
put方法接下来的代码就比较简单了，大家可以自己看，提一句就是put也是有返回值的如果你存放相同的Key的话返回旧的value值，如果是不同的key返回null

HashTable的put

Java代码
public   synchronized V put(K key, V value) {
    // Make sure the value is not null
    if (value == null ) {
        throw   new NullPointerException();
    }

    // Makes sure the key is not already in the hashtable.
    Entry tab[] = table;
    int hash = key.hashCode();
    int index = (hash & 0x7FFFFFFF ) % tab.length;
    for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
        if ((e.hash == hash) && e.key.equals(key)) {
        V old = e.value;
        e.value = value;
        return old;
        }
    }

    modCount++;
    if (count >= threshold) {
        // Rehash the table if the threshold is exceeded
        rehash();

            tab = table;
            index = (hash & 0x7FFFFFFF ) % tab.length;
    }

    // Creates the new entry.
    Entry<K,V> e = tab[index];
    tab[index] = new Entry<K,V>(hash, key, value, e);
    count++;
    return   null ;
    }
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
     throw new NullPointerException();
}

// Makes sure the key is not already in the hashtable.
Entry tab[] = table;
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
     if ((e.hash == hash) && e.key.equals(key)) {
  V old = e.value;
  e.value = value;
  return old;
     }
}

modCount++;
if (count >= threshold) {
// Rehash the table if the threshold is exceeded
rehash();

tab = table;
index = (hash & 0x7FFFFFFF) % tab.length;
}

// Creates the new entry.
Entry<K,V> e = tab[index];
tab[index] = new Entry<K,V>(hash, key, value, e);
count++;
return null;
}

我这里首先就是发现该put是同步的，这是和HashMap的不同。还有这里没有对hash进行处理，而是直接用hash值，在计算数组下标的时候也和HashMap不同，他这里就是采用了普通的求模操作，在求模之前对hash值进行取绝对值操作，保证计算出来的下标是正的；我们可以看出差别了，单从计算下标这一点，HashMap是比HashTable有优化的。

这里我们再来总结一下：HashMap对hash值进行了处理（处理的目的：1是为了得到一个正数，另外一个是为了在进行接下来indexFor 计算时尽可能的得到均匀的下标值）；HashTable没有对hash值进行处理，只是简单的进行了一下hash & 0x7FFFFFFF操作（取绝对值）；HashMap在进行index计算是使用了求与，而Hashtable采用了求模，HashMap之所以可以采用求与来替代求模前提是建立在数组长度总是2的幂数上，我们可以这么说HashMap采用了2的幂数的长度和求与的结合达到了HashTable中求模的效果，从而提高了效率。

关于HashMap和HashTable剩下的方法，我这里就不做更详细的介绍了，大家有兴趣看看应该明白了，理解了put方法，那么别的都好理解了。
[/list]
anson在这里感谢大家花了这么长时间阅读该文章，希望能给大家带了一些帮助，另外上面的分析都是我个人的理解，肯定存在一定的局限性，大家有什么更深刻的认识，还请大家指出来，我们一起交流，共同进步

文章来自：http://blog.csdn.net/lbdf001/archive/2009/12/21/5050500.aspx

分享到：

关于解决MyEclipse 的耗内存的办法 | javascript面向对象技术基础(二)

2010-01-27 17:23
浏览 1467
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论