`
acen.chen
  • 浏览: 154629 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

hashcode,equals

阅读更多

在往HashSet集合中放数据的时候,由于HashSet底层是用HashMap中的Key属性存储的,所以是不能重复的,那他如

 

何判断其不是重复的元素呢.这个时候他判断有两步.

  1.调用元素的hashcode方法,判断两对象的hashCode是否相等,如果不相等,则认为两对象不相等,结束.如果相等,则转入equals方法进行判断.

  2.如果equals方法返回true则,是相等的.如果返回false则是不相等的.结束.这里是最终结果.

 

如果希望某个类作为HashMap的键,则此类必须实现自己的hashCode和equals方法。

hashcode只用于实现查找hash地址,equals方法严格判断两个对象是否相等。

 

这里顺便提一下HashMap的性能因子,要理解这个问题必须解释一些术语。

容量(Capacity):散列表中bucket的数量,俗称桶的数量

初始化容量(initial capacity):创建散列表时桶的数量。HashMap和HashSet都允许在构造函数中指定初始化容量

尺寸(Size):当前散列表中记录的数量

负载因子(load factor):等于”尺寸/容量“。负载因子为0,表示空的散列表,0.5表示半满的散列表,以此类推。

轻负载的散列表具有冲突少,适宜插入与查询的特点。较高的负载因子虽然会降低空间的需求,但会提高查询的时间开销。

如果知道HashMap中会有很多记录,在创建时就使用较大的初始化容量,这样可以避免自动重散列的开销。

总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。
你知道它们的区别吗?前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。
那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢?
这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。
也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。   
于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。
哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法,那需要更多的文章篇幅,我在这里就不介绍了。
初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。  
这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。
如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,
就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。
所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。  
所以,Java对于eqauls方法和hashCode方法是这样规定的:
1、如果两个对象相同,那么它们的hashCode值一定要相同;2、如果两个对象的hashCode相同,它们并不一定相同     上面说的对象相同指的是用eqauls方法比较。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics