hashcode,equals

acen.chen

浏览: 154629 次
性别:
来自: 深圳

最近访客更多访客>>

jingc6108

xiaojin21cen

huoxp007

liuyiyou

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

算法

在往HashSet集合中放数据的时候,由于HashSet底层是用HashMap中的Key属性存储的,所以是不能重复的,那他如

何判断其不是重复的元素呢.这个时候他判断有两步.

1.调用元素的hashcode方法,判断两对象的hashCode是否相等,如果不相等,则认为两对象不相等,结束.如果相等,则转入equals方法进行判断.

2.如果equals方法返回true则,是相等的.如果返回false则是不相等的.结束.这里是最终结果.

如果希望某个类作为HashMap的键，则此类必须实现自己的hashCode和equals方法。

hashcode只用于实现查找hash地址,equals方法严格判断两个对象是否相等。

这里顺便提一下HashMap的性能因子，要理解这个问题必须解释一些术语。

容量（Capacity）：散列表中bucket的数量，俗称桶的数量

初始化容量（initial capacity）：创建散列表时桶的数量。HashMap和HashSet都允许在构造函数中指定初始化容量

尺寸（Size）：当前散列表中记录的数量

负载因子（load factor）：等于”尺寸/容量“。负载因子为0，表示空的散列表，0.5表示半满的散列表，以此类推。

轻负载的散列表具有冲突少，适宜插入与查询的特点。较高的负载因子虽然会降低空间的需求，但会提高查询的时间开销。

如果知道HashMap中会有很多记录，在创建时就使用较大的初始化容量，这样可以避免自动重散列的开销。

总的来说，Java中的集合（Collection）有两类，一类是List，再有一类是Set。
你知道它们的区别吗？前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。
那么这里就有一个比较严重的问题了：要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？
这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。
也就是说，如果集合中现在已经有1000个元素，那么第1001个元素加入集合时，它就要调用1000次equals方法。这显然会大大降低效率。
于是，Java采用了哈希表的原理。哈希（Hash）实际上是个人名，由于他提出一哈希算法的概念，所以就以他的名字命名了。
哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法，那需要更多的文章篇幅，我在这里就不介绍了。
初学者可以这样理解，hashCode方法实际上返回的就是对象存储的物理地址（实际可能并不是）。
这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。
如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，
就调用它的equals方法与新元素进行比较，相同的话就不存了，不相同就散列其它的地址。
所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。
所以，Java对于eqauls方法和hashCode方法是这样规定的：
1、如果两个对象相同，那么它们的hashCode值一定要相同；2、如果两个对象的hashCode相同，它们并不一定相同     上面说的对象相同指的是用eqauls方法比较。