Java集合HashSet源码剖析
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable
HashSet实现Set接口,内部维护一个HashMap实例变量。不保证顺序,允许null元素。
对于基本的操作,如add,remove,contains,size,只需要常量的时间复杂度。
不是线程安全的,如果在多线程环境下,需要被同步化,如调用方法Collections.synchronizedSet(new HashSet())。
HashSet的迭代器是快速失败的,如果一个HashSet在迭代器被创建后被改变(不是使用迭代器的remove方法),迭代器会抛出ConcurrentModificationException。
private transient HashMap<E,Object> map;
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();
两个实例变量,map是内部维护的HashMap,PRESENT是放到HashMap的value的变量。
5个构造器:
//空set, map对象的初始容量16,负载因子0.75
public HashSet() {
map = new HashMap<>();
}
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
//初始化容量,使用默认负载因子0.75
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
//使用LinkedHashMap,dummy参数的作用只是与使用HashMap实现的构造器有不一样的
//方法签名
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
//使用的是HashMap的键集合,返回的迭代器是键集合的迭代器
public Iterator<E> iterator() {
return map.keySet().iterator();
}
//放进map的键值对是,参数e和常量PRESENT,所有键值对的值都是同一个Object对象
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
如果元素e已经存在HashSet之中,不改变Set并返回false,如果e不在HashSet之中,返回true
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
如果o在HashSet中,返回值是true,否则为false
还有一些其他方法没列出来,如size,isEmpty。
HashSet有实现Clonable接口,所以有clone方法,实现Serializable接口,所以有writeObject,readObject序列化反序列化方法。