Set集合通用知识
Set集合与Collection基本上完全一样,没有提供任何额外的方法。实际上Set就是Collection,只是行为不同(Set不允许包含重复元素)
set集合不允许包含相同的元素,如果试图把两个相同元素加入同一个Set集合中,则添加操作失败,add方法返回false,且新元素不会被加入。
问1:Set集合如何判断两个对象是否相同?
答:Set集合判断两个对象是否相同,是使用equals方法,而不是使用运算符==的。即,如果两个对象用equals方法比较返回false,Set就不会接受这两个对象了。
举例如下:
package day0211;
import java.util.HashSet;
import java.util.Set;public class TestSet1 {
/**
* @param args * 以下代码看出Set集合只接受同一对象一次出现 * 因为如果Set集合是用==运算符判断两个对象是否相等的话,我们通过new来创建逆战,两次的对象肯定不同,会返回true * 而结果显示只有一个逆战的字符串,所以Set集合是用equals来比较两个字符串的。 */ public static void main(String[] args) { Set<String> s1 = new HashSet<String>(); s1.add("周杰伦"); s1.add("谢霆锋"); s1.add(new String("逆战")); s1.add(new String("逆战")); System.out.println(s1); }}运行结果如下:
[周杰伦, 逆战, 谢霆锋]
HashSet类
HashSet类是Set接口的典型实现,大多数时候使用Set集合时就是使用这个实现类的。HashSet按Hash算法来存储集合中的元素,因此具有很到的存取和查找性能。
HashSet具有以下的特点:
①不能保证元素的排列顺序,顺序有可能发生变化
②HashSet不是同步的,即线程不安全的,如果多个线程同时访问一个Set集合,如果有2条或者2条以上线程同时修改了HashSet集合时,必须通过代码来保证其同步。
③集合元素可以是null值,但也只能是一个。
问题1:HashSet几个是如何存储元素的?
答:当向HashSet集合存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据该HashCode值来决定该对象在HashSet中的存储位置。如果两个元素通过equals方法比较返回true,但是它们的hashCode()方法的返回值不相等,HashSet将会把它们存储在不同位置,也就可以添加成功。
问题2:HashSet集合如何判断两个对象是否相同?
答:HashSet集合判断两个对象是否相同的标准是两个对象通过equa方法比较相等,并且对象的hashCode()方法返回值也相等。
举例如下:
package day0211;
import java.util.HashSet;
public class TestSet2 {
public static void main(String[] args) {
HashSet hs=new HashSet(); hs.add(new A()); hs.add(new A()); hs.add(new B()); hs.add(new B()); hs.add(new C()); hs.add(new C()); System.out.println(hs); }}class A {
public boolean equals(Object obj) { return true; }}
class B {
public int hashCode() { return 1; } }class C {
public boolean equals(Object obj) { return true; } public int hashCode() { return 2; }}
运行结果如下:
[day0211.B@1, day0211.B@1, day0211.A@1bc4459, day0211.C@2, day0211.A@150bd4d]
解释:上面程序中hs集合中分别添加了2个A对象,2个B对象,2个C对象,其中C类重写了equals()方法总是返回true、hashCode()方法总是返回2,这将导致HashSet将会把两个C对象当成同一个对象。
注意点:如果需要把一个对象放入HashSet中时,如果重写该对象的对应类的equals()方法时,也应该重写其hashCode()方法,
其规则是:如果2个对象通过equals方法比较返回true,这两个对象的hashCode也应该相同。
这样就不能添加两个一样的元素了,因为两个对象通过equals方法比较返回true,但这两个对象的hashCode()方法返回不同的hashCode时,将导致HashSet会把这两个对象保存在HashSet的不同位置,从而这两个对象都能添加成功,这与Set集合的规则是相违背的。
相反:如果两个对象的hashCode()方法返回相同的hashCode,但是两个对象通过equals方法比较返回false更加麻烦!因为两个对象的hashCode值相同,HashSet试图将它们保存在同一个位置,但实际上不行。
hash算法:能保证通过一个对象快速查找到另一个对象。可以根据该元素的值得到该元素保存在何处。那么hashCode就是元素的索引。
重写hashCode()方法的基本规则:
①当两个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相等
②对象中用作equals比较标准的属性,都应该用来计算hashCode值
重写hashCode()的方法:
①对象内每个要用作equals()比较标准的属性f,计算出hashCode值。
如果字段是boolean 计算为hashCode=(f?1:0);
如果字段是byte,char,short,int则计算为hashCode=(int)f;
如果字段是long 计算为hashCode=(int)(f^(f>>>32));
如果字段是float 计算为hashCode=Float.floatToLongBits(f);
如果字段是double,计算为
long l=Double.doubleToIntBits(f);
hashCode=(int)(l^(1>>>32));
如果字段是一个引用对象,那么直接调用对象的hashCode方法,即hashCode=f.hashCode();
如果需要判空,可以加上如果为空就返回0;
②用第一步中计算出来多个hashCode组合计算出一个hashCode值返回。如: return f1.hashCode()+(int)f2;
或者避免直接相加产生偶然情况,可以为各属性乘以任意一个质数后再相加,如: return f1.hashCode()*17+(int)f2*13;
注意:当向HashSet中添加可变对象时,必须十分小心,如果修改了HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。
HashSet还有一个子类LinkedHashSet
LinkedHashSet集合也是根据元素hashCode值来决定元素的存储位置,但它同时使用链表维护元素的次序,这样使得元素看起来是以插入的顺序保存的。也就是遍历LinkedHashSet集合里的元素时,HashSet将会按照元素的添加顺序来访问集合里的元素。
LinkedHashSet与HashSet比较:
前者性能略低于后者,但是迭代访问全部元素时有很好的性能,因为它是以链表来维护内部顺序的。
举例:
package day0211;
import java.util.LinkedHashSet;
public class TestSet3 {
/**
* 以下代码验证了LinkedHashSet集合内的元素的顺序与添加顺序一致 */ public static void main(String[] args) { LinkedHashSet<String> lhs = new LinkedHashSet<String>(); lhs.add("java"); lhs.add("andriod"); lhs.add("c++"); lhs.add("linux"); System.out.println("lhs集合内的元素有:" + lhs); lhs.remove("c++"); System.out.println("lhs集合内的元素有:" + lhs); lhs.add("c++"); System.out.println("lhs集合内的元素有:" + lhs); }}运行结果如下:
lhs集合内的元素有:[java, andriod, c++, linux]
lhs集合内的元素有:[java, andriod, linux]lhs集合内的元素有:[java, andriod, linux, c++]TreeSet类
TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态。
TreeSet还提供了额外的方法:
Comparator comparator():返回当前Set使用的Comparator,或者返回null,表示以自然方式排序
Object first():返回集合中的第一个元素
Object last():返回集合中的最后一个元素
Object lower(Object e):返回集合中小于指定元素的最大元素
Object higher(Object e):返回集合中大于指定元素的最小元素
SortedSet subSet(fromElement,toElement):返回此Set的子集合,范围从fromElement(包含)到toElement(不包含)。
SortedSet headSet(toElement):返回此Set的子集合,由小于toElement的元素组成
SortedSet tailSet(fromElement):返回此Set的子集合,由大于fromElement的元素组成
举例如下:
package day0211;
import java.util.TreeSet;
public class TestSet4 {
/**
*/ public static void main(String[] args) { TreeSet<String> ts=new TreeSet<String>(); ts.add("豆豆"); ts.add("胖胖"); ts.add("乐乐"); ts.add("财发"); System.out.println("集合中元素有:"+ts); System.out.println("集合中第一个元素是:"+ts.first()); System.out.println("集合中最后一个元素是:"+ts.last()); //返回比豆豆小的元素组成的集合 System.out.println(ts.headSet("豆豆")); //返回大于等于豆豆的元素的新集合 System.out.println(ts.tailSet("豆豆")); //返回大于胖胖的元素的最小元素 System.out.println(ts.higher("胖胖")); //返回小于豆豆的元素的最大元素 System.out.println(ts.lower("豆豆")); //返回从胖胖(包含)到财发(不包含)的元素 System.out.println(ts.subSet("胖胖", "财发")); }}运行结果如下:
集合中元素有:[乐乐, 胖胖, 豆豆, 财发]
集合中第一个元素是:乐乐集合中最后一个元素是:财发[乐乐, 胖胖][豆豆, 财发]豆豆胖胖[胖胖, 豆豆]以上结果显示TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值来进行排序的。
TreeSet的两种排序方法:自然排序和定制排序,默认情况下,使用自然排序。
自然排序:TreeSet会调用集合元素的comparaTo(Object obj)方法来比较元素之间大小关系,然后将集合元素按升序排列。
comparaTo(Object obj)方法:是定义在Comparable接口中的,该方法返回一个整数值,实现该接口的类必须实现该方法,实现了该接口的类的对象也就可以比较大小了。当一个对象调用该方法与另一个对象进行比较,例如:obj1.compareTo(obj2),如果该方法返回0,则表明这两个对象相等,如果该方法返回一个正整数,则表明obj1大于obj2;如果该方法返回一个负整数,则表明obj1小于obj2。
java的一些常用类已经实现了Comparable接口,并提供比较大小的标准。如下是已经实现的常用类:
BigDecimal、BigInteger以及所有数值型对应包装类:按它们对应的数值的大小进行比较。
Character:按字符的UNICODE值进行比较。
Boolean:true对应的包装类实例大于false对应的包装类实例。
String:按字符串中字符的UNICODE值进行比较。
Date、Time:后面的时间、日期比前面的时间、日期大。
如果试图把一个对象添加进TreeSet时,则该对象的类必须实现Comparable接口,否则程序将会跑出异常。
例子:
package day0211;
import java.util.TreeSet;
class F {
}
public class TestSet5 {
/**
* 上面的程序试图向TreeSet集合添加两个A()对象,添加第一个对象时,TreeSet里没有任何元素,所以不会出现问题; * 当添加第二个A()对象时,TreeSet就会调用该对象的compareTo(Object obj)方法与几个中其他元素进行比较, * 如果其对应的类(即例子中的A类)没有实现Comparable接口,就会引发ClassCastException异常。 */public static void main(String[] args) {
TreeSet ts = new TreeSet(); ts.add(new F());//会报错
// ts.add(new F()); System.out.println("集合中元素有:" + ts);}
}运行结果会报错!Exception in thread "main" java.lang.ClassCastException: day0211.F cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(TreeMap.java:542) at java.util.TreeSet.add(TreeSet.java:238) at day0211.TestSet5.main(TestSet5.java:12)注意点1:上面的程序试图向TreeSet集合添加两个A()对象,添加第一个对象时,TreeSet里没有任何元素,所以不会出现问题;当添加第二个A()对象时,TreeSet就会调用该对象的compareTo(Object obj)方法与几个中其他元素进行比较,如果其对应的类(即例子中的A类)没有实现Comparable接口,就会引发ClassCastException异常。
注意点2:大部分类在实现compareTo(Object obj)方法,都需要将被比较对象obj强制类型转换成相同类型,因为只有相同类的两个实例才会比较大小。比如:当试图将一个对象添加到TreeSet集合中,TreeSet会调用该对象的compareTo(Object obj)方法与集合中其他元素进行比较,这就要求集合中其他元素与该元素是同一个类的实例,即向TreeSet中添加的应该是同一个类的对象,否则会也会引发ClassCastException异常。
举例:
package day0211;
import java.util.TreeSet;
public class TestSet6 {
public static void main(String[] args) {
TreeSet ts = new TreeSet(); ts.add(new String("豆豆")); //以下代码报错,类型不一致 //ts.add(new Date()); }}问题:TreeSet集合如何判断两个对象不相等?
答:标准是两个对象通过equals方法比较返回false,或者通过compareTo(Object obj)比较没有返回0(返回0,表示两个对象相等),即使两个对象是同一个对象,TreeSet也会把它当成两个对象进行处理。
注意:当需要把一个对象放入TreeSet时,重写该对象对应类的equals()方法时,要保证该方法与compareTo(Object obj)方法有一致的结果;
其规则是:如果两个对象通过equals方法比较返回true时,这两个对象通过compareTo(Object obj)方法比较应该返回0。
如果两个对象通过equals方法比较返回true时,但是这两个对象通过compareTo(Object obj)方法比较不返回0时,会导致TreeSet将这两个对象保存在不同的位置,从而两个都被添加成功,这与Set集合的规则有出入。
相反:当两个对象通过compareTo(Object obj)方法比较应该返回0时,但两个对象通过equals方法比较返回false更麻烦!因为两个对象通过compareTo(Object obj)方法比较相同,TreeSet试图将它们保存在同一个位置,但实际上不行。
注意: 注意:当向TreeSet中添加可变元素的属性,必须十分小心,当试图删除该对象时, TreeSet在处理这些对象时将很容易出错
故:在HashSet和TreeSet 集合只推荐仿佛不可变对象!
定制排序:如果需要实现定制排序,例如以降序排序,则可以使用Comparator接口的帮助。该接口里包含一个int compare(T o1,T o2)方法,该方法用于比较o1和o2的大小,如果该方法返回正整数,则表明o1大于o2;如果该方法返回0,则表明o1等于o2;如果该方法返回负整数,则表明o1小于o2。如果需要实现定制排序,则需要在创建TreeSet集合对象时,并提供一个Comparator对象与该TreeSet集合关联,由该Comparator对象负责集合元素的排序逻辑。
EnumSet类
EnumSet是一个专为枚举类设计的集合类,EnumSet中所有值都必须是指定枚举类型的枚举值,该枚举类型在创建EnumSet时显示或隐式的指定。EnumSet的集合元素也是有序的,EnumSet以枚举值在Enum类内的定义顺序来决定集合元素的顺序。
注意点:
1.EnumSet集合不允许加入null元素。如果试图插入,将抛出异常。如果仅仅只是试图测试是否出现null元素或删除null元素都不会抛出异常,删除操作会返回false
2.EnumSet类没有暴露任何构造器来创建该类的实例,程序应该通过它提供的static方法来创建EnumSet对象:
一些常用static方法来创建EnumSet对象:
static EnumSet allof(Class elementType):创建一个包含指定枚举类里所有枚举值的EnumSet es4对象。
static EnumSet complementOf(EnumSet s):创建一个其元素类型与指定EnumSet里的元素类型相同的EnumSet,新的EnumSet集合包含原EnumSet集合所不包含的、此枚举类剩下的枚举值(即新的EnumSet集合和原来的EnumSet集合的集合元素加起来就是该枚举类的所有枚举值)
static EnumSet copyOf(Collection c):使用一个普通集合来创建EnumSet集合
static EnumSet copyOf(EnumSet s):创建一个与指定EnumSet具有相同元素类型、相同集合元素的EnumSet。
static EnumSet noneOf(Class elementType):创建一个元素类型为指定枚举类型的空EnumSet.
static EnumSet of(E first,E...rest):创建一个包含一个或多个枚举值的EnumSet,传入的多个枚举值必须属于同一个枚举类。
static EnumSet range(E from,E to):创建包含从from枚举值,到to枚举值范围内所有枚举值的EnumSet集合。
举例如下:
package day0212;
import java.util.Collection;
import java.util.EnumSet;import java.util.HashSet;enum Season
{ SPRING,SUNMMER,FALL,WINTER }public class TestEnumSet {
public static void main(String[] args) {
EnumSet es1=EnumSet.allOf(Season.class); System.out.println("集合es1中的元素包括:"+es1); EnumSet es2=EnumSet.noneOf(Season.class); System.out.println("集合es2中的元素包括:"+es2); es2.add(Season.SUNMMER); es2.add(Season.SPRING); System.out.println("集合es2中的元素包括:"+es2); EnumSet es3=EnumSet.of(Season.SUNMMER, Season.WINTER); System.out.println("集合es3中的元素包括:"+es3); EnumSet es4=EnumSet.range(Season.SUNMMER, Season.WINTER); System.out.println("集合es4中的元素包括:"+es4); EnumSet es5=EnumSet.complementOf(es4); System.out.println("集合es5中的元素包括:"+es5); Collection c1=new HashSet(); System.out.println("集合c1中的元素包括:"+c1); c1.add(Season.SPRING); c1.add(Season.WINTER); EnumSet es6=EnumSet.copyOf(c1); System.out.println("集合c1中的元素包括:"+c1); System.out.println("集合es6中的元素包括:"+es6); /** * 以下代码会报错当EnumSet集合中的所有元素是由Collection集合中复制而来的时候, * 要求Collection集合中的元素是同一个枚举类的枚举值。 */ // c1.add("你好"); // EnumSet es7=EnumSet.copyOf(c1); // System.out.println("集合c1中的元素包括:"+c1); // System.out.println("集合es7中的元素包括:"+es7); }}
运行结果如下:
集合es1中的元素包括:[SPRING, SUNMMER, FALL, WINTER]
集合es2中的元素包括:[]集合es2中的元素包括:[SPRING, SUNMMER]集合es3中的元素包括:[SUNMMER, WINTER]集合es4中的元素包括:[SUNMMER, FALL, WINTER]集合es5中的元素包括:[SPRING]集合c1中的元素包括:[]集合c1中的元素包括:[SPRING, WINTER]集合es6中的元素包括:[SPRING, WINTER]总结如下:
1. HashSet和TreeSet是Set两个典型实现,如何选择 HashSet和TreeSet呢?
答:HashSet的性能总是比TreeSet好,因为TreeSet额外要维护集合元素的次序,只有当需要一个保持排序的Set时,才使用TreeSet,否则都应该使用HashSet。
2.HashSet还有一个子类:LinkedHashSet,对于普通插入、删除操作,LinkedHashSet比HashSet要略微慢点,这是由于维护链表所带来的额外开销造成的,不过,因为有了链表,遍历LinkedHashSet会更快。
3.EnumSet是所有Set实现类中性能最好的,但是它只能保存同一个枚举类的枚举值作为集合元素。
4.Set的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的。如果有多条线程同时访问一个Set集合,并且超过一条线程修改了该Set集合,必须手动保证Set集合的同步性。通常使用Collections工具类的synchronizedSortedSet方法来“包装”该Set集合,此操作最好在创建时进行。例如:SortedSet s=Collections.synchronizedSortedSet(new TreeSet(...));