Java学习之路（十一）：Java集合

技术2023-12-31 81

一、Java集合框架概述

集合、数组都是对多个数据（对象）进行存储操作的结构，简称Java容器说明：此时的存储，只要指的是内存层面的存储，不涉及到持久化的存储数组在存储多个数据方面的特点一旦初始化以后，其长度就确定了数组一旦定义好了，其元素的类型也就确定了。所以我们只能去操作指定类型的数据了。如：String[] arr 数组在存储多个数据方面的缺点一旦初始化以后，其长度就不可修改。数组中提供的方法非常有限，对于添加、删除、插入数据等操作，非常不方便，同时效率不高获取数组中实际元素的个数的需求，数组没有现成的属性或方法可用数组存储数据的特点：有序，可重复。对于无序、不可重复的需求无法满足 Java集合可分为Collection和Map两种体系 Collection接口：单列数据，定义了存取一组对象的方法的集合 ① List：元素有序，可重复 ——> "动态"数组 ② Set：元素无序，不可重复 ——> 高中讲【】的“集合” Map接口：双列数据，保存具有映射关系“key-value”的集合 ——> 高中函数 y=f(x)

二、Collection接口方法

package collection; import org.junit.Test; import java.util.*; /** * @author ZC * @Description 测试Collection接口中的方法 * @date 2020-07-03 18:31 */ public class CollectionTest { @Test public void test(){ Collection coll = new ArrayList(); Collection coll1 = new ArrayList(); //1.add(Object o):将元素o添加到集合coll中 coll.add("AA"); coll.add("BB"); coll.add("123"); coll1.add(123);//自动装箱 coll1.add(new Date()); //2.addAll(Collection c):将c集合中的元素添加到当前的集合中 coll.addAll(coll1); System.out.println(coll); //3.size()：获取添加到集合的元素的个数 System.out.println(coll.size()); //4.isEmpty():判断当前集合是否为空 System.out.println(coll.isEmpty()); //5.clear()：清空集合元素 coll1.clear(); System.out.println(coll1.isEmpty()); //6.contains(Object obj):判断当前集合是否包含obj, // 在判断时判断，会调用的是obj对象所在类的equals()方法 System.out.println(coll.contains("AA"));//true System.out.println(coll.contains(new String("AA")));//true //7.containsAll(Collection coll1):判断形参coll1的所有元素是否都存在于当前集合中 Collection coll2 = new ArrayList(); coll2.add("AA"); coll2.add("CC"); System.out.println(coll.containsAll(coll2)); //8.remove(Object obj): 先调用obj对象的equals()判断集合中是否存在该数据，如果有则从集合中移除 System.out.println(coll2.remove("CC")); //9.removeAll(Collection coll1):从当前集合中移除coll1集合中的所有元素 System.out.println(coll); coll.removeAll(coll2); System.out.println(coll); //10. retainAll(Collection coll1):交集：获取当前集合和coll1集合的交集，并返回给当前集合 coll1.retainAll(coll); System.out.println(coll1); //11. equals(Object obj):判断当前集合和形参集合的元素是否都相同 Collection coll3 = new ArrayList(); coll3.add("AA"); coll3.add("BB"); Collection coll4 = new ArrayList(); coll4.add("BB"); coll4.add("AA"); System.out.println(coll3.equals(coll4)); //false //12.hashCode(): 返回当前对象的哈希值值 System.out.println(coll.hashCode()); //13. toArrat(): 集合 ———> 数组 Object[] objects = coll.toArray(); for (int i = 0; i < objects.length; i++) { System.out.println(objects[i]); } //扩展：数组 ———> 集合 List<String> list = Arrays.asList(new String[]{"AA", "BB"}); System.out.println(list); List<int[]> list1 = Arrays.asList(new int[]{123, 123}); System.out.println(list1.size()); //1 List<Integer> list2 = Arrays.asList(new Integer[]{123, 123}); System.out.println(list2.size()); //2 //14.iterator()：返回Iterator的实例，用于遍历集合元素，在下面第三点 } }

三、Iterator迭代器接口

集合元素的遍历操作（遍历的是Collection），使用Iterator（迭代器）接口

hasNext()：判断是否还有下一个元素next()：①指针下移 ②将下移以后集合元素位置上的元素返回

注意：迭代器只是用来遍历集合中的元素，即迭代器本身是不存储数据的

remove()：可以在遍历的时候，删除集合中的元素。此方法不同于集合直接调用remove()

foreach底层使用的就是迭代器

package collection; import org.junit.Test; import java.util.ArrayList; import java.util.Collection; import java.util.Iterator; /** * @author ZC * @Description 迭代器接口测试 * @date 2020-07-04 14:25 */ public class IteratorTest { @Test public void test(){ Collection coll = new ArrayList(); coll.add("123"); coll.add(456); coll.add(new String("Tom")); coll.add(false); /** * 迭代器，搭配着hasNext()和next()方法使用 */ Iterator iterator = coll.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); } /** * remove() 方法 */ iterator = coll.iterator(); while(iterator.hasNext()){ Object obj = iterator.next(); if ("Tom".equals(obj)){ iterator.remove(); } } } }

四、Collection子接口 —— List

1. ArrayList的源码分析

作为List的主要实现类，线程不安全，效率高

JDK7情况下构造器：ArrayList list = new ArrayList()，底层创建了长度是10的Object[] 数组elementData第一次调用添加操作，list.add(123) ——> elementData[0] = new Integer(123)如果某次添加导致底层elementData数组容量不够，则扩容。默认情况下，扩容为原来容量的1.5倍，同时需要将原有数组中的数据复制到新的数组中。结论：建议开发中使用带参的构造器：ArrayList list = new ArrayList(int capacity) JDK8中ArrayList的变化构造器：ArrayList list = new ArrayList()，底层Object[] 数组elementData初始化为{}，并没有创建长度为10的数组第一次调用添加操作，list.add(123) 时，底层才创建了长度为10的数组，并将数据123 添加到 elementData[0]后续的添加和扩容操作与 JDK7 无异小结：JDK7 中ArrayList的对象的创建类似于单例模式的饿汉式；JDK8 中ArrayList的创建类似于单例模式的懒汉式，延迟了数组的创建，节省了内存。

2. LinkedList

LinkedList list = new LinkedList(),内部声明了Node类型的first和last，默认值为nulllist.add(123),将123封装到Node中，创建了Node对象，然后通过prev和next连接到双向链表上

3. Vector

作为古老的实现类，线程安全，效率低，JDK1.0就有了

Vector vector = new Vector()，底层创建了长度是10的Object[] 数组elementData扩容：扩为原来容量的2倍.

ArrayList、LinkedList、Vector三者的异同：Java学习之路（三）：不同结构的区别(更新中)中的第十二点

4.List接口的方法

5.总结List常用的方法

增：add(Object obj)删：remove(int index) /remove(Object obj)改：set(int index,Object obj)查：get(int index)插：add(int index,Object obj)长度：size()遍历： ①迭代器Iterator方式 ②增强for循环（foreach） ③普通的循环

五、Collection子接口 —— Set

Set接口概述 Set接口是collection的子接口，Set接口没有提供额外的方法，即使用的方法都是Collection接口中的方法Set集合不允许包含相同的元素，如果试把两个相同的元素加入同一个Set集合中，则操作失败Set集合判断两个对象是否相同不是使用 == 运算符，而是根据equals()方法对于存放在Set容器中的对象，对应的类一定要重写equals()和hashCode(Object obj)方法，以实现对象相等原则。重写的两个方法要保持一致性，即：“相等对象必须拥有相等的散列码”重写两个方法的小技巧：对象中用作equals()方法比较的field，都应该用来计算hashCode值。

1. HashSet（七上八下）

HashSet是Set接口的典型实现，大多数时候使用Set结合时都使用这个实现类。HashSet按Hash算法来存储集合中的元素，因此具有很好的存取、查找、删除性能HashSet具有以下特点不能保证元素的排列顺序HashSet不是线程安全的，即效率高集合元素可以是null HashSet集合判断两个元素相等的标准：两个对象通过hashCode()方法比较相等，并且两个对象的equals()方法返回值也相等HashSet底层存储结构：数组+链表

以HashSet为例说明

Set：存储无序、不可重复的数据无序性：不等于随机性，存储的数据在底层数组中并非按照数组的索引的顺序添加的，而是根据数据的Hash值添加的不可重复性：保证添加的元素按照equals()判断时，不能返回true，即相同元素只能添加一个添加元素的过程：以HashSet为例我们想HashSet中添加元素a，首先调用元素a所在类的hashCode()方法，计算元素a的哈希值，此哈希值接着通过某种算法计算出在HashSet底层数组中存放的位置（即为：索引位置），判断数组此位置上是否已经有元素：如果此位置没有其他元素，则元素a添加成功 ——>情况1如果此位置有其他元素b（或以链表形式存在多个元素），则比较元素a与其他元素的哈希值是否相同：如果哈希值不同，则元素a添加成功 ——>情况2如果哈希值相同，进而需要调用元素a所在类的equals()方法： equals()返回true，元素a添加失败equals()返回false，元素a添加成功 ——>情况3

对于添加成功的情况2和情况3而言：元素a与已经存在指定索引位置上的元素以链表的形式存储（七上八下）

jdk7：元素a放到数组中，作为链表的表头jdk8：元素b接到链表后，作为链表的表尾

2. LinkedHashSet

作为HashSet的子类，遍历其内部数据时，可以按照添加的顺序去遍历优点：对于频繁的遍历操作，LinkedHashSet效率高于HashSet

3. TreeSet

TreeSet 是 SortedSet接口的实现类，TreeSet可以确保集合元素处于排序状态内部实现 TreeSet底层使用红黑树结构存储数据向TreeSet中添加的数据，要求是同个类的对象自然排序中，判断两个对象是否相同的标准为：compareTo()返回0，不再是equals()定制排序中，判断两个对象是否相同的标准为：compare()返回0，不再是equals() 新增的方法如下：（了解） Comparator comparator()Object first()Object last()Object lower(Object e)Object higher(Object e)SortedSet subSet(fromElement,toElement)SortedSet headSet(toElement)SortedSet tailSet(fromElement) TreeSet两种排序方法：自然排序和定制排序。默认情况下，TreeSet采用自然排序（可以按照添加对象的指定属性进行排序）

六、Map接口

Map：双列数据，存储key-value对的数据

1. HashMap

作为Map的主要实现类；线程不安全，效率高，能够存储null的key和value——健壮性更好 HashMap的底层：JDK7：数组+链表

HashMap map = new HashMap():在实例化以后，底层创建了一个长度为16的一维数组Entry[] table

map.put(key1,value1):首先调用key1所在类的hashCode()计算key的哈希值，此哈希值通过某种算法计算以后，得到在Entry[]数组的位置

如果此位置上的数据为空，此时的key1-value1添加成功 ——>情况1如果此位置上的数据不为空，（意味着存在一个或多个数据（以链表的形式存储）），比较key1与已存在的数据的哈希值如果哈希值不相同，key1-value1添加成功 ——>情况2如果哈希值相同，则调用key1所在类的equals()方法如果equals()返回false：则key1-value1添加成功 ——>情况3如果equals()返回true：则使用value1替换相同key的value值（修改功能）

补充：对于情况2和情况3，此时的key1-value1和原来的数据以链表的方式存储

扩容(当超出临界值且要存放数据的位置非空时)：默认的扩容方式是将容量扩为原来的2倍，并将原有数据复制过来

JDK8：数组+链表+红黑树

相较于JDK7在底层实现方面的不同

new HashMap() :底层没有创建长度为16的数组jdk8底层的数组时Node[ ]，而非Entry[ ]首次调用put()方法时,底层创建一个长度为16的数组jdk7底层结构只有：数组+链表。JDK8中底层结构是：数组+链表+红黑树，当数组的某一个索引位置上的元素以链表的形式存在的数据个数 > 8 且当前数组长度 > 64时，此时此索引位置上的所有数据改为使用红黑树存储

2. LinkedHashMap

是HashMap的子类，保证在遍历map元素时，能够按照添加的顺序遍历原因：在原有HashMap底层结构上，添加了一对引用，指向前一个和后一个元素对于频繁的遍历操作，此类的执行效率要高于HashMap before和after就是用来记录添加的前后顺序的

3. TreeMap

是SortMap接口的实现类，保证按照添加的key-value对进行排序，实现排序遍历，此时考虑的是key的自然排序或定制排序底层使用红黑树向TreeMap中添加key-value，要去key必须是同一个类创建的对象，因为要按照key进行排序：自然排序，定制排序

4. Hashtable

作为古老的实现类，线程安全，效率低，JDK1.0就有了不能够存储null的key和value

5. Properties

常用来处理配置文件，它的key和value都是String类型

Properties类是Hashtable的子类，该对象用来处理属性文件由于属性文件里的key和value都是字符串类型，所以Properties里的key和value都是字符串类型存取数据时，建议使用setProperty(String key,String value)方法和getProperty(String key)方法 Properties pros = new Properties(); pros.load(new FileInputStream("jdbc.properties")); String user = pros.getProperties("user"); System.out.println(user);

6.Map接口的方法

总结：常用方法添加：put(Object key,Object value)删除：remove(Object key)修改：put(Object key,Object value)查询：get(Object key)长度：size()遍历:Set keySet()，Collection values()，Set entrySet()

7.Map结构的理解

Map中的key：无序，不可重复的，使用Set存储 ——> key所在的类要重写hashCode()和equals()，以HashMap为例Map中的value：无序，可重复的，使用Collection存储Map中的Entry：一个键值对（key-value）构成了一个Entry对象，无序，不可重复的，使用Set存储

七、Collections工具类

Collections是一个操作Set、List和Map等集合的工具类（操作数组的工具了是Arrays）Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作，还提供了对集合对象设置不可变、对集合对象实现同步控制等方法排序操作：（均为static方法） reverse(List)：反转List中元素的顺序shuffle(List)：对List集合元素进行随机排序sort(List)：根据元素的自然顺序对指定List集合元素按升序排序sort(List,Comparator)：根据指定的Comparator产生的顺序对List集合元素进行排序swap(List,int,int)：将指定list集合中 i 处元素和 j 处元素进行交换查找、替换 Object max(Collection)：根据元素的自然排序，返回给定集合中的最大元素Object max(Collection,Comparator)：根据Comparator指定的顺序，返回给定集合中的最大元素Object min(Collection)：据元素的自然排序，返回给定集合中的最小元素Object min(Collection,Comparator)：根据Comparator指定的顺序，返回给定集合中的最小元素int frequency(Collection,Object)：返回指定集合中指定元素出现的次数void copy(List dest,List src)：将src中的内容复制的dest中boolean replaceAll(List list,Object oldVal,Object newVal)：使用newVal替换List集合中所有oldVal package collections; import org.junit.Test; import java.util.ArrayList; import java.util.Arrays; import java.util.Collections; import java.util.List; /** * @author ZC * @Description Collections工具类方法测试 * @date 2020-07-05 21:59 */ public class CollectionsTest { @Test public void test(){ List list = new ArrayList(); list.add(123); list.add(333); list.add("asd"); list.add(1234); //错误写法:java.lang.IndexOutOfBoundsException: Source does not fit in dest // List list1 = new ArrayList(); // Collections.copy(list1,list); //表中写法 List list1 = Arrays.asList(new Object[list.size()]); System.out.println(list1); Collections.copy(list1,list); System.out.println(list1); } } Collections类中提供了多个synchronizedXxx()方法，该方法可使指定集合包装成线程同步的集合，从而可以解决多线程并发访问集合时的线程安全问题

Processed: 0.022, SQL: 9