理解java虚拟机内存收集

    技术2025-11-15  18

    学习《深入理解Java虚拟机》时个人的理解笔记

    1、为什么要去了解垃圾收集和内存回收技术?

    当需要排查各种内存溢出、内存泄漏问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就必须对这些“自动化”的技术实施必要的监控和调节。

    2、“哲学三问”内存收集

    what?when?how?

    那些内存需要回收?什么时候回收?如何回收?

    这是一个整体的问题,确定了什么状态的内存可以回收,才可以在内存“死”掉时及时地回收它们。只有了解了“死”掉内存的特性,才可以确定合理的回收方式。

    3、如何确定内存已经“死”掉呢?

    在Java的世界,内存承载的都是对象,内存的“死”去,代表着对象的“死”去,即对象不再被需要了(任何途径都再能使用到了)。

    这里有两种方式去确定:

    3.1、引用计数算法(Reference Counting)

    在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零就是不可能再被使用的。

    然而:

    在Java领域,至少主流的Java虚拟机里面都没有选用引用计数来管理内存,主要原因是,这个看似简单的算法有很多例外情况要考虑,必须要配合大量额外处理才能保证正确地工作,譬如单纯的引用计数就很难解决对象之间相互循环引用的问题。

    3.2、可达性分析算法(Reachability Analysis)

    基本思路:通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象时不可能再被使用的。

    Java技术系统下,作为GC Roots的对象:

    在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。在方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。在方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用。在本地方法栈中JNI(即通常所说的Native方法)引用的对象。Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象(比如NullPointException、OutOfMemoryError)等,还有系统类加载器。所有被同步锁(synchronized关键字)持有的对象。反映Java虚拟机内部情况的JMXBean、JVMTI中的注册的回调、本地代码缓存等。

    3.3、再谈引用

    在JDK1.2以后,java对引用的概念进行了扩充,将引用分为强引用(Strongly Reference)、软引用(Soft Reference)、弱引用(Weak Reference)和虚引用(Phantom Reference)四种。按强度依次逐渐减弱。

    强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj = new Object()”这种引用关系。无论任何情况下,只要强引用关系存在,垃圾收集器就永远不会回收掉被引用的对象。软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围内,进行第二次回收。如果回收后还是内存不够,就是抛出内存溢出异常。JDK 1.2 以后 SoftReference 类来实现软引用。弱引用也是用来描述那些非必须对象,在下次垃圾回收时被回收。JDK 1.2 以后 WeakReference 类来实现。虚引用也成为“幽灵引用”或者“幻影引用”,它时最弱的一钟引用关系。存在不影响其生存。唯一的功能是在被回收时收到一个系统通知。JDK 1.2 以后 PhantomReference 类来实现虚引用。

    4、那些内存需要回收呢?

    根据Java虚拟机规范,当一个台Java虚拟机运行起来时,其主要内存区域有如下:

    线程共享

    方法区(Method Area)堆(Heap)

    线程隔离

    虚拟机栈(VM Stack)本地方法栈(Native Method)程序计数器(Program Counter Register)

    当然还有其他一些,但是这些并不直接和客户程序关联,暂时不关心。

    线程隔离的区域,虚拟机栈、本地方法栈、程序计数器在线程产生时写入内存,在线程结束时自动回收,一般不需要太多管理。

    线程共享的区域:

    方法区

    在Java虚拟机规范中没有要求必须实现垃圾收集,本身的回收率也不高。但是也可以进行回收的。其回收的主要内容为:废弃的常量和不再使用的类型。

    堆(Heap)

    这里才是Java世界中,回收的主要战场。

    5、何如进行垃圾收集呢?

    从如何判定对象的消亡角度,收集算法可以划分为“引用计数式来垃圾收集(Reference Counting GC)”和“追踪式垃圾收集(Trace Counting GC)”。同判定对象“死亡”一样。我们主要关注在后者。

    遵循分代收集理论去设计垃圾收集器。 理论假说:

    弱分代假说(Weak Generational Hypothesis):绝大部分对象都是朝生夕灭的。强分代假说(Strong Generational Hypothesis):熬过越多次垃圾收集过程的对象就越难以消灭。

    扩展 3. 跨代引用假说(Intergenerational Reference Hypothesis):跨代引用相对于同代引用来说仅占极少数。

    基于分代收集理论的三种收集算法。

    标记-清除算法标记-复制算法标记-整理算法

    如下图:

    6、一句理解垃圾收集

    主要发生在堆中,不可达对象,通过收集算法进行回收。

    参考

    《深入理解Java虚拟机》第三版,周志明著。

    Processed: 0.018, SQL: 9