java 集合中Set接口、数据结构

印度阿三17 2021-02-24

展开全文

集合中Set接口、数据结构

.Set接口
数据结构

.Set接口

特点：无序、不允许重复，是Collection接口的子接口

没有定义新方法，所有的方法都是Collection接口中所定义的方法

实现类

HashSet存储采用哈希表的方式进行存储，HashSet采用HashCode算法来存取集合中的元素，因此具有比较好的读取和查找性能

LinkedHashSet是在HashSet的基础上添加一个额外的链表结构可以记录存储数据的顺序

TreeSet采用的是树状结构进行数据存储

HashSet

类定义
在这里插入图片描述

数据的存储方式
在这里插入图片描述
底层实现方法：存储到Set中的所有数据最终都存储在一个HashMap中，其中存储的数据采用key的方式进行存储，值为PRESENT常量

常用算法

boolean add(E e)向集合Set中添加元素，注意不保证顺序
在这里插入图片描述
同一个内容的对象，为什么没有出现覆盖的效果？

设置hashCode和equals方法的调用
比对两个对象相等，调用流程为：
1、调用对象的hashcode方法，如果hashCode不相等则返回，认为两个对象不相等。
2、如果hash值相等则调用equals判断

潜规则要求：定义类时需要定义对应的hashCode和equals方法，要求：当equals为true时，hash值必须相等；当hash值相等时不一定equals为true

选择参与比较的属性值即可，IDE工具自动生成对应的方法

boolean remove(Object o) 删除指定对象，同样需要hashCode和equals方法

void clear()清空集合中的所有元素

boolean contains(Object o)判断集合中是否有指定的对象，同样需要hashCode和equals方法

int size()获取集合中的元素个数

Iterator iterator()用于遍历所存储的数据

Set<String> set = new LinkedHashSet<>();
set.add("abcd");
set.add("123");
Iterator<String> it=set.iterator();
while(it.hasNext()) {
String tmp=it.next();
System.out.println(tmp);
}

HashSet的特征

无序：不仅不能保证元素插入的顺序（如果需要顺序则可以使用LinkedHashSet），而且在元素在以后的顺序中也可能变化（这是由HashSet按HashCode存储对象（元素）决定的，对象变化则可能导致HashCode变化）

如果需要访问的顺序和插入的顺序一致，可以使用HashSet的子类LinkedHashSet不允许重复 [equals和hashcode]

**结论：**当HashSet判定对象重复时，首先调用的是对象的hashCode方法，如果两个对象的hashCode值相同时，才调用equals进行判定。如果hashCode值不相等则不会调用equals判断。如果 hashcode相等而且equals为true，则后盖前

HashSet是线程非安全的，方法上没有同步约束
HashSet元素值可以为NULL

LinkedHashSet

类定义

在这里插入图片描述
没有什么新方法，仅仅只是在HashSet的基础上添加了一个链表结构记录存取的顺序

LinkedHashSet是HashSet的一个子类，LinkedHashSet也根据HashCode的值来决定元素的存储位置，但同时它还用一个链表来维护元素的插入顺序，插入的时候即要计算hashCode又要维护链表，而遍历的时候只需要按链表来访问元素

TreeSet

TreeSet实现了SortedSet接口，顾名思义这是一种排序的Set集合
在这里插入图片描述
数据存储采用的是

在map中以key为需要存放的数据，以PERSENT常量为值存放数据

内部实现
底层是用TreeMap实现的，本质上是一个红黑树原理。正因为它是排序了的，所以相对HashSet来说，TreeSet提供了一些额外的按排序位置访问元素的方法，例如first(), last(), lower(), higher(), subSet(), headSet(), tailSet()

基本用法

Set<Integer> set = new TreeSet<Integer>();
Random r = new Random();
for (int i = 0; i < 10; i  )
set.add(r.nextInt(100));
set.forEach(System.out::println);

TreeSet的排序分两种类型，一种是自然排序，另一种是定制排序。
编程使用TreeSet
在这里插入图片描述
执行报错

原因是：添加到TreeSet中要求对象必须是可比较的

要求添加到TreeSet中的元素类型必须实现Comparable接口

public class A {
public static void main(String[] args) {
Set<Person> set=new TreeSet<Person>();
Person p1=new Person(1L,"能能");
Person p2=new Person(1L,"能能");
set.add(p1);
set.add(p2);
System.out.println(set.size());
System.out.println(p1==p2);
System.out.println(p1.equals(p2));
}
}

class Person implements Comparable<Person>{
private Long id;
private String name;
public Person(long l, String string) {
this.id=l;
this.name=string;
}
@Override
public int compareTo(Person o) {
//判空处理省略
int res=name.compareTo(o.name);
if(res==0) {
res=id.compareTo(o.id);
}
return res;
}

}

如果使用TreeSet时不会依靠hashcode和equals进行比较，相等性判断是依靠compareTo实现的

自然排序

（在元素中写排序规则）

TreeSet 会调用compareTo方法比较元素大小，然后按升序排序（从小到达）。所以自然排序中的元素对象，都必须实现了Comparable接口，否则会抛出异常。对于TreeSet判断元素是否重复的标准，也是调用元素从Comparable接口继承而来compareTo方法，如果返回0则是重复元素。Java的常见类都已经实现了Comparable接口

给Person类上添加针对Comparable接口的实现：考虑具体的业务规则，按照类中什么属性进行排序比较
在这里插入图片描述