分享

Java集合体系结构分析与比较

 腾飞工作室 2014-02-15

1.  Java集合框架图

Java平台提供了一个全新的集合框架.“集合框架主要由一组用来操作对象的接口组成.不同接口描述一组不同数据类型.

Java集合框架图如下:

集合接口:6个接口(短虚线表示),表示不同集合类型,是集合框架的基础.

抽象类:5个抽象类(长虚线表示),对集合接口的部分实现.可扩展为自定义集合类.

实现类:8个实现类(实线表示),对接口的具体实现.

在很大程度上,一旦您理解了接口,您就理解了框架.虽然您总要创建接口特定的实现,但访问实际集合的方法应该限制在接口方法的使用上;因此,允许您更改基本的数据结构而不必改变其它代码.

Java集合的顶层接口是Collection,Collection 接口是一组允许重复的对象.Java集合框架主要由以下三个接口组成:

    (1) Set 接口继承Collection,但不允许重复,使用自己内部的一个排列机制.

    (2) List 接口继承Collection,允许重复,以元素安插的次序来放置元素,不会重新排列.

(3) Map接口是一组成对的键-值对象,即所持有的是key-value pairs.Map中不能有重复的key,拥有自己的内部排列机制.

容器中的元素类型都为Object,从容器取得元素时,必须把它转换成原来的类型.简化后的集合框架图如下:

2.  接口Collection

    用于表示任何对象或元素组,想要尽可能以常规方式处理一组元素时,就使用这一接口.

    (1) 单元素添加、删除操作:

    boolean add(Object o):将对象添加给集合

    boolean remove(Object o): 如果集合中有与o相匹配的对象,则删除对象o

    (2) 查询操作:

    int size():返回当前集合中元素的数量

    boolean isEmpty():判断集合中是否有任何元素

    boolean contains(Object o):查找集合中是否含有对象o

    Iterator iterator():返回一个迭代器,用来访问集合中的各个元素

    (3) 组操作:作用于元素组或整个集合

    boolean containsAll(Collection c): 查找集合中是否含有集合c 中所有元素

    boolean addAll(Collection c) : 将集合c 中所有元素添加给该集合

    void clear(): 删除集合中所有元素

    void removeAll(Collection c) : 从集合中删除集合c 中的所有元素

    void retainAll(Collection c) : 从集合中删除集合c 中不包含的元素

    (4) Collection转换为Object数组:

    Object[] toArray():返回一个内含集合所有元素的array

Object[] toArray(Object[] a):返回一个内含集合所有元素的array.运行期返回的array和参数a的型别相同,需要转换为正确型别.

此外,您还可以把集合转换成其它任何其它的对象数组.但是,您不能直接把集合转换成基本数据类型的数组,因为集合必须持有对象.

斜体接口方法是可选的.因为一个接口实现必须实现所有接口方法,调用程序就需要一种途径来知道一个可选的方法是不是不受支持.如果调用一种可选方法时,一个 UnsupportedOperationException 被抛出,则操作失败,因为方法不受支持.此异常类继承 RuntimeException ,避免了将所有集合操作放入 try-catch .

  Collection不提供get()方法.如果要遍历Collectin中的元素,就必须用Iterator.

2.1 抽象类AbstractCollection

    AbstractCollection 类提供具体集合框架类的基本功能.虽然您可以自行实现 Collection 接口的所有方法,但是,除了iterator()size()方法在恰当的子类中实现以外,其它所有方法都由 AbstractCollection 类来提供实现.如果子类不覆盖某些方法,可选的如add()之类的方法将抛出异常.

2.2 接口Iterator

    Collection 接口的iterator()方法返回一个 Iterator.Iterator接口方法能以迭代方式逐个访问集合中各个元素,并安全的从Collection 中除去适当的元素.

    (1) boolean hasNext(): 判断是否存在另一个可访问的元素

    Object next(): 返回要访问的下一个元素.如果到达集合结尾,则抛出NoSuchElementException异常.

    (2) void  remove(): 删除上次访问返回的对象.本方法必须紧跟在一个元素的访问后执行.如果上次访问后集合已被修改,方法将抛出IllegalStateException.

Iterator中删除操作对底层Collection也有影响.

 迭代器是故障快速修复(fail-fast).这意味着,当另一个线程修改底层集合的时候,如果您正在用 Iterator 遍历集合,那么,Iterator就会抛出 ConcurrentModificationException (一种 RuntimeException异常)异常并立刻失败.

在遍历Iterator时不能对底层Collection执行remove()操作.

3. 接口List

     List 接口继承了 Collection 接口以定义一个允许重复项的有序集合.该接口不但能够对列表的一部分进行处理,还添加了面向位置的操作.

    (1)  面向位置的操作包括插入某个元素或 Collection 的功能,还包括获取、除去或更改元素的功能. List 中搜索元素可以从列表的头部或尾部开始,如果找到元素,还将报告元素所在的位置 :

    void add(int index, Object element): 在指定位置index上添加元素element

    boolean addAll(int index, Collection c): 将集合c的所有元素添加到指定位置index

    Object get(int index): 返回List中指定位置的元素

    int indexOf(Object o): 返回第一个出现元素o的位置,否则返回-1

    int lastIndexOf(Object o):返回最后一个出现元素o的位置,否则返回-1

    Object remove(int index) :删除指定位置上的元素

    Object set(int index, Object element):用元素element取代位置index上的元素,并且返回旧的元素

    (2) List 接口不但以位置序列迭代的遍历整个列表,还能处理集合的子集:

    ListIterator listIterator() : 返回一个列表迭代器,用来访问列表中的元素

    ListIterator listIterator(int index) : 返回一个列表迭代器,用来从指定位置index开始访问列表中的元素

    List subList(int fromIndex, int toIndex):返回从指定位置fromIndex(包含)toIndex(不包含)范围中各个元素的列表视图

    对子列表的更改( add()remove() set() 调用)对底层 List 也有影响.

  3.1 接口ListIterator

  ListIterator 接口继承 Iterator 接口以支持添加或更改底层集合中的元素,还支持双向访问.ListIterator没有当前位置,光标位于调用previousnext方法返回的值之间.一个长度为n的列表,n+1个有效索引值:

    (1) void add(Object o): 将对象o添加到当前位置的前面

    void set(Object o): 用对象o替代nextprevious方法访问的上一个元素.如果上次调用后列表结构被修改了,那么将抛出IllegalStateException异常.

    (2)  boolean hasPrevious(): 判断向后迭代时是否有元素可访问

    Object previous():返回上一个对象

    int nextIndex(): 返回下次调用next方法时将返回的元素的索引

    int previousIndex(): 返回下次调用previous方法时将返回的元素的索引

3.2 抽象类AbstractListAbstractSequentialList

有两个抽象的 List 实现类:AbstractList AbstractSequentialList. AbstractSet 类一样,它们覆盖了 equals() hashCode() 方法以确保两个相等的集合返回相同的哈希码.若两个列表大小相等且包含顺序相同的相同元素,则这两个列表相等.这里的 hashCode() 实现在 List 接口定义中指定,而在这里实现.

除了equals()hashCode(),AbstractListAbstractSequentialList实现了其余 List 方法的一部分.因为数据的随机访问和顺序访问是分别实现的,使得具体列表实现的创建更为容易.需要定义的一套方法取决于您希望支持的行为.您永远不必亲自提供的是 iterator方法的实现.

3.3 LinkedListArrayListVector

集合框架中有两种常规的 List 实现:ArrayList LinkedList.使用两种 List 实现的哪一种取决于您特定的需要.如果要支持随机访问,而不必在除尾部的任何位置插入或除去元素,那么,ArrayList 提供了可选的集合.但如果,您要频繁的从列表的中间位置添加和除去元素,而只要顺序的访问列表元素,那么,LinkedList 实现更好.

ArrayList LinkedList 都实现 Cloneable 接口,都提供了两个构造函数,一个无参的,一个接受另一个Collection

  3.1.1 LinkedList

    LinkedList类添加了一些处理列表两端元素的方法.

    (1)  void addFirst(Object o): 将对象o添加到列表的开头

    void addLast(Object o):将对象o添加到列表的结尾

    (2)  Object getFirst(): 返回列表开头的元素

    Object getLast(): 返回列表结尾的元素

    (3)  Object removeFirst(): 删除并且返回列表开头的元素

    Object removeLast():删除并且返回列表结尾的元素

    (4)  LinkedList(): 构建一个空的链接列表

LinkedList(Collection c): 构建一个链接列表,并且添加集合c的所有元素

    使用这些新方法,您就可以轻松的把 LinkedList 当作一个堆栈、队列或其它面向端点的数据结构.

  3.1.2 ArrayList

ArrayList类封装了一个动态再分配的Object[]数组.每个ArrayList对象有一个capacity.这个capacity表示存储列表中元素的数组的容量.当元素添加到ArrayList,它的capacity在常量时间内自动增加.

    在向一个ArrayList对象添加大量元素的程序中,可使用ensureCapacity方法增加capacity.这可以减少增加重分配的数量.

    (1)  void ensureCapacity(int minCapacity): ArrayList对象容量增加minCapacity

    (2)  void trimToSize(): 整理ArrayList对象容量为列表当前大小.程序可使用这个操作减少ArrayList对象存储空间.

  3.1.3 Vector

    Vector类似于ArrayList.API的角度来看这两个类非常相似.Vector是同步的,这个类中的一些方法保证了Vector中的对象是线程安全的.ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的.

  3.1.4 三者之间的区别

  3.1.4.1    LinkedListArrayList的区别

      ArrayList:支持随机访问,不必在除尾部的任何位置插入或除去元素.

      LinkedList:频繁的从列表的中间位置添加和除去元素,而只要顺序的访问列表元素.

  3.1.4.2    VectorArrayList的区别

  (1) 同步性

    Vector是同步的.这个类中的一些方法保证了Vector中的对象是线程安全的.ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的.因为同步的要求会影响执行的效率,所以如果你不需要线程安全的集合那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销.

  (2) 数据增长

    从内部实现机制来讲ArrayListVector都是使用数组(Array)来控制集合中的对象.当你向这两种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度,Vector缺省情况下自动增长原来一倍的数组长度,ArrayList是原来的50%,所以最后你获得的这个集合所占的空间总是比你实际需要的要大.所以如果你要在集合中保存大量的数据那么使用Vector有一些优势,因为你可以通过设置集合的初始化大小来避免不必要的资源开销.

  (3) 使用模式

ArrayListVector,从一个指定的位置(通过索引)查找数据或是在集合的末尾增加、移除一个元素所花费的时间是一样的,这个时间我们用O(1)表示.但是,如果在集合的其他位置增加或移除元素那么花费的时间会呈线形增长:O(n-i),其中n代表集合中元素的个数,i代表元素增加或移除元素的索引位置.为什么会这样呢?以为在进行上述操作的时候集合中第i和第i个元素之后的所有元素都要执行位移的操作.这一切意味着什么呢?

这意味着,你只是查找特定位置的元素或只在集合的末端增加、移除元素,那么使用VectorArrayList都可以.如果是其他操作,你最好选择其他的集合操作类.比如,LinkList集合类在增加或移除集合中任何位置的元素所花费的时间都是一样的-O(1),但它在索引一个元素的使用却比较慢-O(i),其中i是索引的位置.使用ArrayList也很容易,因为你可以简单的使用索引来代替创建iterator对象的操作.LinkList也会为每个插入的元素创建对象,所有你要明白它也会带来额外的开销.

最后,在《Practical Java》一书中Peter Haggar建议使用一个简单的数组(Array)来代替VectorArrayList.尤其是对于执行效率要求高的程序更应如此.因为使用数组(Array)避免了同步、额外的方法调用和不必要的重新分配空间的操作.

4. 接口Set

    Set 接口继承 Collection 接口,而且它不允许集合中存在重复项,每个具体的 Set 实现类依赖添加的对象的 equals()方法来检查独一性,因此加入SetObject必须定义equals()方法以确保对象的唯一性.Set接口没有引入新方法,所以Set就是一个Collection,只不过其行为不同.

4.1 Hash

Hash表是一种数据结构,用来查找对象.Hash表为每个对象计算出一个整数,称为Hash Code(哈希码).Hash表是个链接式列表的阵列.每个列表称为一个buckets(哈希表元).对象位置的计算 index = HashCode % buckets (HashCode为对象哈希码,buckets为哈希表元总数).

当你添加元素时,有时你会遇到已经填充了元素的哈希表元,这种情况称为Hash Collisions(哈希冲突).这时,你必须判断该元素是否已经存在于该哈希表中.

如果哈希码是合理地随机分布的,并且哈希表元的数量足够大,那么哈希冲突的数量就会减少.同时,你也可以通过设定一个初始的哈希表元数量来更好地控制哈希表的运行.初始哈希表元的数量为 buckets = size * 150% + 1 (size为预期元素的数量).

如果哈希表中的元素放得太满,就必须进行rehashing(再哈希).再哈希使哈希表元数增倍,并将原有的对象重新导入新的哈希表元中,而原始的哈希表元被删除.load factor(加载因子)决定何时要对哈希表进行再哈希.Java编程语言中,加载因子默认值为0.75,默认哈希表元为101.

    4.2 接口ComparableComparator

  集合框架中有两种比较接口:Comparable接口和Comparator接口.StringIntegerJava内建类实现Comparable接口以提供一定排序方式,但这样只能实现该接口一次.对于那些没有实现Comparable接口的类、或者自定义的类,您可以通过Comparator接口来定义您自己的比较方式.

    4.2.1 接口Comparable

  java.lang包中,Comparable接口适用于一个类有自然顺序的时候.假定对象集合是同一类型,该接口允许您把集合排序成自然顺序.

  (1) int compareTo(Object o): 比较当前实例对象与对象o,如果位于对象o之前,返回负值,如果两个对象在排序中位置相同,则返回0,如果位于对象o后面,则返回正值

  Java 2 SDK版本1.4中有二十四个类实现Comparable接口.下表展示了8种基本类型的自然排序.虽然一些类共享同一种自然排序,但只有相互可比的类才能排序.

   

    排序

    BigDecimal,BigInteger,Byte, Double,

    Float,Integer,Long,Short

    按数字大小排序

    Character

    Unicode 值的数字大小排序

    String

    按字符串中字符 Unicode 值排序

  利用Comparable接口创建您自己的类的排序顺序,只是实现compareTo()方法的问题.通常就是依赖几个数据成员的自然排序.同时类也应该覆盖equals()hashCode()以确保两个相等的对象返回同一个哈希码.

    4.2.2 接口Comparator

  若一个类不能用于实现java.lang.Comparable,或者您不喜欢缺省的Comparable行为并想提供自己的排序顺序(可能多种排序方式),你可以实现Comparator接口,从而定义一个比较器.

  (1)int compare(Object o1, Object o2): 对两个对象o1o2进行比较,如果o1位于o2的前面,则返回负值,如果在排序顺序中认为o1o2是相同的,返回0,如果o1位于o2的后面,则返回正值

  Comparable相似,0返回值不表示元素相等.一个0返回值只是表示两个对象排在同一位置.Comparator用户决定如何处理.如果两个不相等的元素比较的结果为零,您首先应该确信那就是您要的结果,然后记录行为.

    (2)boolean equals(Object obj): 指示对象obj是否和比较器相等.

  该方法覆写Objectequals()方法,检查的是Comparator实现的等同性,不是处于比较状态下的对象.

    4.3 接口SortedSet

  “集合框架提供了个特殊的Set接口:SortedSet,它保持元素的有序顺序.SortedSet接口为集的视图(子集

上一条: C语言程序当中异常安全的思考 下一条: Tomcat 7 的七大新特性

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多