一、Java集合框架概述
集合、数组都是对多个数据(对象)进行存储操作的结构,简称Java容器
说明:此时的存储,只要指的是内存层面的存储,不涉及到持久化的存储 数组在存储多个数据方面的特点
一旦初始化以后,其长度就确定了数组一旦定义好了,其元素的类型也就确定了。所以我们只能去操作指定类型的数据了。如:String[] arr 数组在存储多个数据方面的缺点
一旦初始化以后,其长度就不可修改。数组中提供的方法非常有限,对于添加、删除、插入数据等操作,非常不方便,同时效率不高获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用数组存储数据的特点:有序,可重复。对于无序、不可重复的需求无法满足
Java集合可分为Collection和Map两种体系
Collection接口:单列数据,定义了存取一组对象的方法的集合 ① List:元素有序,可重复 ——> "动态"数组 ② Set:元素无序,不可重复 ——> 高中讲【】的“集合” Map接口:双列数据,保存具有映射关系“key-value”的集合 ——> 高中函数 y=f(x)
二、Collection接口方法
package collection
;
import org
.junit
.Test
;
import java
.util
.*
;
public class CollectionTest {
@Test
public void test(){
Collection coll
= new ArrayList();
Collection coll1
= new ArrayList();
coll
.add("AA");
coll
.add("BB");
coll
.add("123");
coll1
.add(123);
coll1
.add(new Date());
coll
.addAll(coll1
);
System
.out
.println(coll
);
System
.out
.println(coll
.size());
System
.out
.println(coll
.isEmpty());
coll1
.clear();
System
.out
.println(coll1
.isEmpty());
System
.out
.println(coll
.contains("AA"));
System
.out
.println(coll
.contains(new String("AA")));
Collection coll2
= new ArrayList();
coll2
.add("AA");
coll2
.add("CC");
System
.out
.println(coll
.containsAll(coll2
));
System
.out
.println(coll2
.remove("CC"));
System
.out
.println(coll
);
coll
.removeAll(coll2
);
System
.out
.println(coll
);
coll1
.retainAll(coll
);
System
.out
.println(coll1
);
Collection coll3
= new ArrayList();
coll3
.add("AA");
coll3
.add("BB");
Collection coll4
= new ArrayList();
coll4
.add("BB");
coll4
.add("AA");
System
.out
.println(coll3
.equals(coll4
));
System
.out
.println(coll
.hashCode());
Object
[] objects
= coll
.toArray();
for (int i
= 0; i
< objects
.length
; i
++) {
System
.out
.println(objects
[i
]);
}
List
<String> list
= Arrays
.asList(new String[]{"AA", "BB"});
System
.out
.println(list
);
List
<int[]> list1
= Arrays
.asList(new int[]{123, 123});
System
.out
.println(list1
.size());
List
<Integer> list2
= Arrays
.asList(new Integer[]{123, 123});
System
.out
.println(list2
.size());
}
}
三、Iterator迭代器接口
集合元素的遍历操作(遍历的是Collection),使用Iterator(迭代器)接口
hasNext():判断是否还有下一个元素next():①指针下移 ②将下移以后集合元素位置上的元素返回
注意:迭代器只是用来遍历集合中的元素,即迭代器本身是不存储数据的
remove():可以在遍历的时候,删除集合中的元素。此方法不同于集合直接调用remove()
foreach底层使用的就是迭代器
package collection
;
import org
.junit
.Test
;
import java
.util
.ArrayList
;
import java
.util
.Collection
;
import java
.util
.Iterator
;
public class IteratorTest {
@Test
public void test(){
Collection coll
= new ArrayList();
coll
.add("123");
coll
.add(456);
coll
.add(new String("Tom"));
coll
.add(false);
Iterator iterator
= coll
.iterator();
while(iterator
.hasNext()){
System
.out
.println(iterator
.next());
}
iterator
= coll
.iterator();
while(iterator
.hasNext()){
Object obj
= iterator
.next();
if ("Tom".equals(obj
)){
iterator
.remove();
}
}
}
}
四、Collection子接口 —— List
1. ArrayList的源码分析
作为List的主要实现类,线程不安全,效率高
JDK7情况下
构造器:ArrayList list = new ArrayList(),底层创建了长度是10的Object[] 数组elementData第一次调用添加操作,list.add(123) ——> elementData[0] = new Integer(123)如果某次添加导致底层elementData数组容量不够,则扩容。默认情况下,扩容为原来容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
JDK8中ArrayList的变化
构造器:ArrayList list = new ArrayList(),底层Object[] 数组elementData初始化为{},并没有创建长度为10的数组第一次调用添加操作,list.add(123) 时,底层才创建了长度为10的数组,并将数据123 添加到 elementData[0]后续的添加和扩容操作与 JDK7 无异
小结:JDK7 中ArrayList的对象的创建类似于单例模式的饿汉式;JDK8 中ArrayList的创建类似于单例模式的懒汉式,延迟了数组的创建,节省了内存。
2. LinkedList
LinkedList list = new LinkedList(),内部声明了Node类型的first和last,默认值为nulllist.add(123),将123封装到Node中,创建了Node对象,然后通过prev和next连接到双向链表上
3. Vector
作为古老的实现类,线程安全,效率低,JDK1.0就有了
Vector vector = new Vector(),底层创建了长度是10的Object[] 数组elementData扩容:扩为原来容量的2倍.
ArrayList、LinkedList、Vector三者的异同:Java学习之路(三):不同结构的区别(更新中)中的第十二点
4.List接口的方法
5.总结List常用的方法
增:add(Object obj)删:remove(int index) /remove(Object obj)改:set(int index,Object obj)查:get(int index)插:add(int index,Object obj)长度:size()遍历: ①迭代器Iterator方式 ②增强for循环(foreach) ③普通的循环
五、Collection子接口 —— Set
Set接口概述
Set接口是collection的子接口,Set接口没有提供额外的方法,即使用的方法都是Collection接口中的方法Set集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set集合中,则操作失败Set集合判断两个对象是否相同不是使用 == 运算符,而是根据equals()方法对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等原则。重写的两个方法要保持一致性,即:“相等对象必须拥有相等的散列码”重写两个方法的小技巧:对象中用作equals()方法比较的field,都应该用来计算hashCode值。
1. HashSet(七上八下)
HashSet是Set接口的典型实现,大多数时候使用Set结合时都使用这个实现类。HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除性能HashSet具有以下特点
不能保证元素的排列顺序HashSet不是线程安全的,即效率高集合元素可以是null HashSet集合判断两个元素相等的标准:两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相等HashSet底层存储结构:数组+链表
以HashSet为例说明
Set:存储无序、不可重复的数据
无序性:不等于随机性,存储的数据在底层数组中并非按照数组的索引的顺序添加的,而是根据数据的Hash值添加的不可重复性:保证添加的元素按照equals()判断时,不能返回true,即相同元素只能添加一个 添加元素的过程:以HashSet为例
我们想HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中存放的位置(即为:索引位置),判断数组此位置上是否已经有元素:
如果此位置没有其他元素,则元素a添加成功 ——>情况1如果此位置有其他元素b(或以链表形式存在多个元素),则比较元素a与其他元素的哈希值是否相同:
如果哈希值不同,则元素a添加成功 ——>情况2如果哈希值相同,进而需要调用元素a所在类的equals()方法:
equals()返回true,元素a添加失败equals()返回false,元素a添加成功 ——>情况3
对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上的元素以链表的形式存储(七上八下)
jdk7:元素a放到数组中,作为链表的表头jdk8:元素b接到链表后,作为链表的表尾
2. LinkedHashSet
作为HashSet的子类,遍历其内部数据时,可以按照添加的顺序去遍历优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
3. TreeSet
TreeSet 是 SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态内部实现
TreeSet底层使用红黑树结构存储数据向TreeSet中添加的数据,要求是同个类的对象自然排序中,判断两个对象是否相同的标准为:compareTo()返回0,不再是equals()定制排序中,判断两个对象是否相同的标准为:compare()返回0,不再是equals() 新增的方法如下:(了解)
Comparator comparator()Object first()Object last()Object lower(Object e)Object higher(Object e)SortedSet subSet(fromElement,toElement)SortedSet headSet(toElement)SortedSet tailSet(fromElement) TreeSet两种排序方法:自然排序和定制排序。默认情况下,TreeSet采用自然排序(可以按照添加对象的指定属性进行排序)
六、Map接口
Map:双列数据,存储key-value对的数据
1. HashMap
作为Map的主要实现类;线程不安全,效率高,能够存储null的key和value——健壮性更好
HashMap的底层:JDK7:数组+链表
HashMap map = new HashMap():在实例化以后,底层创建了一个长度为16的一维数组Entry[] table
map.put(key1,value1):首先调用key1所在类的hashCode()计算key的哈希值,此哈希值通过某种算法计算以后,得到在Entry[]数组的位置
如果此位置上的数据为空,此时的key1-value1添加成功 ——>情况1如果此位置上的数据不为空,(意味着存在一个或多个数据(以链表的形式存储)),比较key1与已存在的数据的哈希值
如果哈希值不相同,key1-value1添加成功 ——>情况2如果哈希值相同,则调用key1所在类的equals()方法
如果equals()返回false:则key1-value1添加成功 ——>情况3如果equals()返回true:则使用value1替换相同key的value值(修改功能)
补充:对于情况2和情况3,此时的key1-value1和原来的数据以链表的方式存储
扩容(当超出临界值且要存放数据的位置非空时):默认的扩容方式是将容量扩为原来的2倍,并将原有数据复制过来
JDK8:数组+链表+红黑树
相较于JDK7在底层实现方面的不同
new HashMap() :底层没有创建长度为16的数组jdk8底层的数组时Node[ ],而非Entry[ ]首次调用put()方法时,底层创建一个长度为16的数组jdk7底层结构只有:数组+链表。JDK8中底层结构是:数组+链表+红黑树,当数组的某一个索引位置上的元素以链表的形式存在的数据个数 > 8 且当前数组长度 > 64时,此时此索引位置上的所有数据改为使用红黑树存储
2. LinkedHashMap
是HashMap的子类,保证在遍历map元素时,能够按照添加的顺序遍历 原因:在原有HashMap底层结构上,添加了一对引用,指向前一个和后一个元素对于频繁的遍历操作,此类的执行效率要高于HashMap before和after就是用来记录添加的前后顺序的
3. TreeMap
是SortMap接口的实现类,保证按照添加的key-value对进行排序,实现排序遍历,此时考虑的是key的自然排序或定制排序底层使用红黑树
向TreeMap中添加key-value,要去key必须是同一个类创建的对象,因为要按照key进行排序:自然排序,定制排序
4. Hashtable
作为古老的实现类,线程安全,效率低,JDK1.0就有了不能够存储null的key和value
5. Properties
常用来处理配置文件,它的key和value都是String类型
Properties类是Hashtable的子类,该对象用来处理属性文件由于属性文件里的key和value都是字符串类型,所以Properties里的key和value都是字符串类型存取数据时,建议使用setProperty(String key,String value)方法和getProperty(String key)方法
Properties pros
= new Properties();
pros
.load(new FileInputStream("jdbc.properties"));
String user
= pros
.getProperties("user");
System
.out
.println(user
);
6.Map接口的方法
总结: 常用方法
添加:put(Object key,Object value)删除:remove(Object key)修改:put(Object key,Object value)查询:get(Object key)长度:size()遍历:Set keySet(),Collection values(),Set entrySet()
7.Map结构的理解
Map中的key:无序,不可重复的,使用Set存储 ——> key所在的类要重写hashCode()和equals(),以HashMap为例Map中的value:无序,可重复的,使用Collection存储Map中的Entry:一个键值对(key-value)构成了一个Entry对象,无序,不可重复的,使用Set存储
七、Collections工具类
Collections是一个操作Set、List和Map等集合的工具类(操作数组的工具了是Arrays)Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法排序操作:(均为static方法)
reverse(List):反转List中元素的顺序shuffle(List):对List集合元素进行随机排序sort(List):根据元素的自然顺序对指定List集合元素按升序排序sort(List,Comparator):根据指定的Comparator产生的顺序对List集合元素进行排序swap(List,int,int):将指定list集合中 i 处元素和 j 处元素进行交换 查找、替换
Object max(Collection):根据元素的自然排序,返回给定集合中的最大元素Object max(Collection,Comparator):根据Comparator指定的顺序,返回给定集合中的最大元素Object min(Collection):据元素的自然排序,返回给定集合中的最小元素Object min(Collection,Comparator):根据Comparator指定的顺序,返回给定集合中的最小元素int frequency(Collection,Object):返回指定集合中指定元素出现的次数void copy(List dest,List src):将src中的内容复制的dest中boolean replaceAll(List list,Object oldVal,Object newVal):使用newVal替换List集合中所有oldVal
package collections
;
import org
.junit
.Test
;
import java
.util
.ArrayList
;
import java
.util
.Arrays
;
import java
.util
.Collections
;
import java
.util
.List
;
public class CollectionsTest {
@Test
public void test(){
List list
= new ArrayList();
list
.add(123);
list
.add(333);
list
.add("asd");
list
.add(1234);
List list1
= Arrays
.asList(new Object[list
.size()]);
System
.out
.println(list1
);
Collections
.copy(list1
,list
);
System
.out
.println(list1
);
}
}
Collections类中提供了多个synchronizedXxx()方法,该方法可使指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题