HashMap中的元素玩起了躲猫猫 -

freish

浏览: 82904 次
性别:
来自: 摄影帝国

最近访客更多访客>>

san_yun

EncodingDete.jar

xjs650614

Sdky

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

我的资讯 ( 0)
我的论坛 ( 1060)
我的问答 ( 225)

存档分类

HashMap中的元素玩起了躲猫猫

博客分类：

java

thread 多线程 J#

当你明明put进了一对非null key-value进了HashMap，某个时候你再用这个key去取的时候却发现value为null，再次取的时候却又没问题，都知道是HashMap的非线程安全特性引起的，分析具体原因如下：

public V get(Object key) {
		if (key == null)
			return getForNullKey();
		int hash = hash(key.hashCode());

		// indexFor方法取得key在table数组中的索引，table数组中的元素是一个链表结构，遍历链表，取得对应key的value
		for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
			Object k;
			if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
				return e.value;
		}
		return null;
	}

再看看put方法：

public V put(K key, V value) {
		if (key == null)
			return putForNullKey(value);
		int hash = hash(key.hashCode());
		int i = indexFor(hash, table.length);
		for (Entry<K, V> e = table[i]; e != null; e = e.next) {
			Object k;
			if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
				V oldValue = e.value;
				e.value = value;
				e.recordAccess(this);
				return oldValue;
			}
		}

		modCount++;
		// 若之前没有put进该key，则调用该方法
		addEntry(hash, key, value, i);
		return null;
	}

再看看addEntry里面的实现：

void addEntry(int hash, K key, V value, int bucketIndex) {
		Entry<K, V> e = table[bucketIndex];
		table[bucketIndex] = new Entry<K, V>(hash, key, value, e);
		if (size++ >= threshold)
			resize(2 * table.length);
	}

里面有一个if块，当map中元素的个数（确切的说是元素的个数-1）大于或等于容量与加载因子的积时，里面的resize是就会被执行到的，继续resize方法：

void resize(int newCapacity) {
		Entry[] oldTable = table;
		int oldCapacity = oldTable.length;
		if (oldCapacity == MAXIMUM_CAPACITY) {
			threshold = Integer.MAX_VALUE;
			return;
		}

		Entry[] newTable = new Entry[newCapacity];
		transfer(newTable);
		table = newTable;
		threshold = (int) (newCapacity * loadFactor);
	}

resize里面重新new一个Entry数组，其容量就是旧容量的2倍，这时候，需要重新根据hash方法将旧数组分布到新的数组中，也就是其中的transfer方法：

void transfer(Entry[] newTable) {
		Entry[] src = table;
		int newCapacity = newTable.length;
		for (int j = 0; j < src.length; j++) {
			Entry<K, V> e = src[j];
			if (e != null) {
				src[j] = null;
				do {
					Entry<K, V> next = e.next;
					int i = indexFor(e.hash, newCapacity);
					e.next = newTable[i];
					newTable[i] = e;
					e = next;
				} while (e != null);
			}
		}
	}

在这个方法里，将旧数组赋值给src，遍历src，当src的元素非null时，就将src中的该元素置null，即将旧数组中的元素置null了，也就是这一句：

if (e != null) {
		src[j] = null;

此时若有get方法访问这个key，它取得的还是旧数组，当然就取不到其对应的value了。

下面，我们重现一下场景：

import java.util.HashMap;
import java.util.Map;
public class TestHashMap {
	public static void main(String[] args) {
		final Map<String, String> map = new HashMap<String, String>(4, 0.5f);
		
		new Thread(){
			public void run() {
				while(true) { 
					System.out.println(map.get("name1"));
					try {
						Thread.sleep(1000);
					} catch (InterruptedException e) {
						e.printStackTrace();
					}
				}
			}
		}.start();
		for(int i=0; i<3; i++) {
			map.put("name" + i, "value" + i);
		}
	}
}

Debug上面这段程序，在map.put处设置断点，然后跟进put方法中，当i=2的时候就会发生resize操作，在transfer将元素置null处停留片刻，此时线程打印的值就变成null了。

总结：HashMap在并发程序中会产生许多微妙的问题，难以从表层找到原因。所以使用HashMap出现了违反直觉的现象，那么可能就是并发导致的了

分享到：

jdk1.7 String switch的实现 | 双重检查锁定失败可能性——参照《The "Dou ...

2011-06-15 17:04
浏览 3116
评论(20)
论坛回复 / 浏览 (18 / 7802)
分类:编程语言
查看更多

20 楼 tianzizhi 2011-06-18

ConcurrentHashMap
Collections.synchronizedMap(map).

这俩不是一个等级的，
第一个是局部加锁，
第二个是整体加锁，
效率差很多

19 楼 angel243fly 2011-06-18

jv520jv 写道

kingkan 写道

HashMap是非线程安全的。

试下用ConcurrentHashMap吧。

楼上说的对,在多线种情况下对一个线程不安全的容器进行操作显然是不对的.还是用ConcurrentHashMap这个比较好或者Collections.synchronizedMap(map).

Collections.synchronizedMap(map)这个更好用些

18 楼 jv520jv 2011-06-17

kingkan 写道

HashMap是非线程安全的。

试下用ConcurrentHashMap吧。

楼上说的对,在多线种情况下对一个线程不安全的容器进行操作显然是不对的.还是用ConcurrentHashMap这个比较好或者Collections.synchronizedMap(map).

17 楼 sebatinsky 2011-06-17

一直么有研究过，哈哈，看完QQ再看。

16 楼 freish 2011-06-17

renwolang521 写道

freish 写道

handby123 写道

看到这我突然想弱弱地问一句：很看到几次HASHMAP通过KEY查找值得时间复杂度为O(1)
然我疑惑的是 get()方法中不是也先要遍历table数组么难道这不算时间复杂度？

是不用遍历table数组的，数组的下标是通过indexFor迅速定位的，但是table中的元素是一个链表，如果hash的加载因子太大，就有可能出现很多元素hash得到的table索引是一样的，这就需要遍历这个链表了

通常你给一个key,通过其hashCode 值然后 indexFor 就可以计算出其数组下标，直接定位到该元素

static int indexFor(int h, int length) {
   return h & (length-1);
}

但是不同对象的hashCode 有可能一样，所以HashMap 中每个key 对应的是一个链表，当两个不同key 的hashCode 相同时，那么就放入到对应的同一个链表里，当你取的时候，根据key的hashCode定位到这个链表（链表中存的是 Entry<K,V> 对象），遍历然后逐个equals key 直到找到元素（不同对象equals绝对是false）。

假如一个链表你直接遍历那么当链表非常大的时候，会非常慢的，但一般情况下不同对象的hashCode值是不同的，根据hashCode 和 indexFor() 直接就能找到该元素的索引，然后直接就取出来了，万一hashCode 相同，仅需要遍历一个相对小的链表即可。

所以
1.当你需要存取大量元素的时候，运用 hashMap 这类集合自然比较高效
2.当你定义一个class的时候，假如需要重写 hashCode 和 equals 方法的时候要注意这两个方法

在定义好hashCode和equals方法后，加载因子就是一个重要因素，加载因子越大，重复的可能性就越大，但table数组的利用率越高；加载因子越小，重复的可能性越小，但table数组很多空间被浪费掉了。需要在时间和空间上有一个折中

15 楼 renwolang521 2011-06-17

freish 写道

handby123 写道

通常你给一个key,通过其hashCode 值然后 indexFor 就可以计算出其数组下标，直接定位到该元素

static int indexFor(int h, int length) {
   return h & (length-1);
}

14 楼 freish 2011-06-17

tianzizhi 写道

楼主只是解释说明一个现象的背后产后的原因，至于为什么不安全用什么安全这个大家都是知道的，呵呵，支持

终于有个明白人

13 楼 tianzizhi 2011-06-16

楼主只是解释说明一个现象的背后产后的原因，至于为什么不安全用什么安全这个大家都是知道的，呵呵，支持

12 楼 kingkan 2011-06-16

HashMap是非线程安全的。

试下用ConcurrentHashMap吧。

11 楼 marshaldong 2011-06-16

freish 写道

handby123 写道

对，这时遍历是因为有了”键冲突“。

10 楼 dingzhaoxu 2011-06-16

yunchow 写道

K，HashMap本来就不是线程安全的，多此一举

9 楼 yunchow 2011-06-16

K，HashMap本来就不是线程安全的，多此一举

8 楼 freish 2011-06-16

handby123 写道

7 楼 handby123 2011-06-16

6 楼 suhuanzheng7784877 2011-06-16

ticmy 写道

我怎么不能评价

四哥~~~顶一个

5 楼 ticmy 2011-06-16

我怎么不能评价

4 楼 freish 2011-06-16

xieboxin 写道

学习了，不过楼主所贴的代码不能正确证明。我改了下，如下：


public static void main(String[] args) {
		final Map<String, String> map = new HashMap<String, String>(4, 0.5f);

		Thread thread = new Thread() {
			@Override
			public void run() {
				while (true) {
					System.out.println(map.get("name1"));
					try {
						Thread.sleep(1000);
					} catch (InterruptedException e) {
						e.printStackTrace();
					}
				}
			}
		};
		thread.setDaemon(true);
		thread.start();
		for (int i = 0; i < 3; i++) {
			map.put("name" + i, "value" + i);
			System.out.println("put");
		}
		try {
			Thread.sleep(1000000);
		} catch (InterruptedException e) {
			e.printStackTrace();
		}
	}

我实际debug的，没问题啊

3 楼 xieboxin 2011-06-15

学习了，不过楼主所贴的代码不能正确证明。我改了下，如下：


public static void main(String[] args) {
		final Map<String, String> map = new HashMap<String, String>(4, 0.5f);

		Thread thread = new Thread() {
			@Override
			public void run() {
				while (true) {
					System.out.println(map.get("name1"));
					try {
						Thread.sleep(1000);
					} catch (InterruptedException e) {
						e.printStackTrace();
					}
				}
			}
		};
		thread.setDaemon(true);
		thread.start();
		for (int i = 0; i < 3; i++) {
			map.put("name" + i, "value" + i);
			System.out.println("put");
		}
		try {
			Thread.sleep(1000000);
		} catch (InterruptedException e) {
			e.printStackTrace();
		}
	}

2 楼大马甲 2011-06-15

学习学习

1 楼 duanhengtao03 2011-06-15

先顶了，然后再看！

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HashMap中的元素玩起了躲猫猫

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HashMap中的元素玩起了躲猫猫

评论

发表评论

相关推荐

hotspot1.7 ThreadPoolExecutor代码解析

ScheduledThreadPoolExecutor实现原理

【备忘】指定eclipse启动时需要的jdk

深入了解Thread#yield

开发、测试java程序时，尽可能使用-server（win上）选项，其他平台使用类似选项，启用JIT优化

java bridge method

jdk1.7 String switch的实现

双重检查锁定失败可能性——参照《The "Double-Checked Locking is Broken" Declaration》

去除bat启动swing应用时甩不掉的小黑框(控制台cmd)

如何通过序列化将输入流写入文件或通过socket传输

rhino（javascript）generated bytecode for method exceeds 64K

最近访客更多访客>>