`

HotSpot JVM 垃圾收集原理(转)

    博客分类:
  • Java
阅读更多
目的:
     本文描述了Sun公司的HotSpot Java虚拟机的垃圾收集工作原理 。以便为更多Java爱好者在设计,开发以及部署时带来更多便利和益处。
摘要:
         JVM 规范中要求任何实现JVM 的实现必须要提供一个能够回收未被使用内存的机制。这个机制就是垃圾回收(GC -Garbage Collection)。然而垃圾回收机制设计的好坏将直接影响依赖其运行的java应用的性能(包括处理能力,响应时间等)。在接下来的章节中将详细介绍SUN公司的Java虚拟机(其正式名称是Sun HotSopt JVM )中的垃圾回收机制。
分代垃圾回收
        HotSpot JVM 使用分代垃圾回收的方式。这种垃圾回收方式并不是HotSpot JVM 的首创,而是人们在实践中发现存在下面的两条规律并在很早的时候就提出来了。即:
1 )大多数对象在创建后很短的时间内就会没有任何对象再使用它了,即未被其它对象引用。
2 )大多数一直被使用的对象(老对象)很少引用新创建的对象。
对于Java应用来说这两条规律始终是存在的,也有人根据这些规律称其为“弱分代”。因为将java对象分为“年轻”对象和“老”对象时并没有一个非常明确的指标而是由JVM 规范的实现者控制的(当然JVM 也可以提供参数让具体的开发者设定)。在HotSpot JVM 中将分配到的内存堆(Heap)分为两个物理区域,一个是“年轻”区,另一个是“老”区。在这里我将“年轻”的一代叫做“新生代”,而对应的将“老”的一代对象叫做“老生代”。
l        新生代:绝大多数新创建的对象存放于此,这个区域一般来说比较小而且垃圾收集的频率也比较高。因为许多对象在创建后很快就会“死”去,在每次的“新生代”垃圾收集后能够“幸存”的对象非常的少。使用在“新生代”的这种垃圾收集叫做次要垃圾收集(Minor Collection)。正是因为“新生代”的大小(较小,寻址时间很短)和其存放的对象的特点(寿命短,所以有很多垃圾,每次收集都能释放较大的内存空间)使得次要垃圾收集的效率非常高。见图1。
 
1 :分代垃圾回收
 
l        老生代:在“新生代”中生存了较长时间的对象将被提升为“老”对象并转移到“老生代”区。这个区域一般要大一些而且增长的速度相对于“新生代”要慢一些,所以负责“老生代”垃圾收集的主垃圾收集(Major Collection)的执行频率与次要垃圾收集比要低很多。主垃圾收集发生在“老生代”中的对象占用的存储空间达到一定的量值的时候。见图1。
* 为方便起见,在下面的章节中将用次收集来替代“次要垃圾收集”,用主收集替代“主要垃圾收集”
为了使次收集的收集时间尽可能的短,HotSpot JVM 使用了一种叫做卡表(Card Table)的机制见图2,来避免在每次进行次收集的时候遍历整个“老生代”。
图2:HotSpot 中的卡表
         卡表的机制是将“老生代”以512字节为单位进行划分,划分得到的每个区域叫做一个卡。每个卡在卡表中有占用一个一个字节的标识。java代码在执行的过程中JVM 一旦发现“老生代”的对象引用了或者释放了“新生代”中的对象,那么JVM 就要将与之对应的卡表中的状态置为相应的值。这样在次收集的时候只遍历被标记为“脏”的卡,以便知道哪些“新生代”的对象被引用中,是不可以进行回收的。
         分代进行垃圾收集的好处是可以根据每个代的具体特点为其设定不同的垃圾收集算法。在新生代中往往使用速度较快的垃圾收集算法,因为次要收集的频率比较高。这种算法在内存的使用效率上没有优势,好在“新生代”的空间占整个JVM 内存堆比例较小,尚不能对性能构成大的问题。而内存使用效率高的算法往往用在“老生代”的垃圾收集上。因为“老生代”占据着JVM 堆的很大部分。虽然“老生代”中进行的主收集每次的收集时间相对于次收集要长好多,但是主收集在频率上要比次收集少很多,故对性能的影响也不大。正是这种新、“老生代”的相互补很好的平衡JVM 垃圾收集中的瓶颈。
新生代的组成
         “新生代”又3个部分组成,见图3。一个Eden和两个生存区( Survivor Space ),
图3:新生代组成
其中:
l        Eden :绝大部分新创建的对象存放在此区域。为什么说绝大多数而不是所有的呢?原因是应用在创建一个非常大的对象的时候JVM 会直接将其分配在老生代而非新生代。在每次完成次收集的时候Eden区域总是空的。
l        存活区:顾名思义在垃圾收集过程中没有被当作垃圾收集的对象将放在次区域中。也就是说这个区域中的对象至少经历了一次次收集。存放存活区的对象在被“提升”到老生代前还有机会被收集。存活区有一对,他们中的一个始终保持为空,另一个用于存放存活下来的对象。
  图4描述了次收集的收集过程,其中绿色部分是未被使用的对象
图4:一次次收集
(即垃圾)。从图中可以看到在Eden区的绿色部分将被收集而幸存下来的对象 (白色部分)将被移到没有被使用的存活区2。在存活区1中的绿色部分是也是不被使用的对象,这些对象也将被收集。而位于存活区1中的蓝色部分是尚被引用但 是还不够“老”的这些对象也将移到到存活区2。存活区1中剩余的部分就是被引用且已经够“老”的对象,他们将被移到老生代区。
         在完成了一次次收集后(见图5),两个存活区就会交互角色。即存活区2中将存放存活对象,存活区1将不被使用。Eden区将会变的空空如也。同时由于有新对象移到了老生代,老生代的空间将被更多的对象占据。
图5:完成一次次收集后
垃圾收集器
        Sun HotSpot JVM 提供了3中不同的垃圾收集器。他们可以根据应用的实际情况有选择性的使用。下面将分别介绍。
串行收集器: 又叫做“标记-压缩”收集器。这种收集器在收集的时候要求JVM 停止执行应用。所以人们戏称这种收集模式为Stop-the-World(停止一切)模式。在完成收集后JVM 才继续执行应用(见图6)。
图6:串行收集
串行收集器首先将 “老生代”中的仍然存活的对象进行标记并将这些对象压缩到“老生代”空间的前端。这样“老生代”的后端将变成一个连续的空间,以便从“新生代”中足够老的 对象顺利的“提升”到“老生代”中(见图7,红色部分为垃圾对象)。对于大多数不要求有非常迅速响应(例如几秒钟)的场合,例如客户端程序,这种收集器还 是能够胜任的。
图7:“老生代”的一次压缩
并行收集器: 在 目前实际的应用中多数的java程序都运行在具有很大物理内存和多个CPU的服务器上。在比较理想的情况下垃圾收集应该能够有效利用所有的CPU,而不是 只用其中的一个且其他的CPU都处于空闲状态。为避免过多的垃圾收集以便提高系统的吞吐量(即处理能力),在服务器模式的环境下Sun的HotSopt JVM 使用 并行收集器进行垃圾回收。因为这种垃圾回收器的一个主要目标是提高吞吐量,所以也叫做吞吐量型的收集器。并行收集器的工作方式是在次收集(对应于“新生 代”)中使用所有的CPU进行并行收集,在主收集(对应于“老生代”)中采用串行收集器(见图8)。虽然与串行收集器相比较主收集没有显著的改善(因为两 者在“老生代”中都使用了相同的串行收集器),但是在次收集部分的效率得以大幅度的提高。进而提高的系统的吞吐量。
图8:并行收集
同步收集器( Mostly-Concurrent Collector 对 于某些的应用程序来说响应速度要远比吞吐量重要。同时收集器就是为低延时而设计的一种收集器。在已经介绍的Stop-the-World(停止一切)的收 集模式中,当垃圾收集没有结束前对于外部的请求是不会进行响应的,直到收集完毕应用才会继续响应请求。这对于次搜集来说一般来说停顿时间不是很长(因为次 收集往往需要很短的时间),但对于主收集来说,即使不是很频繁也会导致应用较长时间的停顿,尤其是在JVM 堆分配的比较大的时候就更明显了。为了解决这种情况Sun JVM 引入了同步收集器的方式。这种方式也叫做同步标记-清楚(CMS)或者还可以叫做“低延迟”收集器。图9展示了其工作原理
图9:同步收集器
同步收集器以一个短 暂的停顿开始,在这个短暂的停顿中将对那些能够迅速确定不是垃圾的对象进行标记。紧接着将进入同步标记阶段,在这个阶段中同步收集器对被使用的对象进一步 进行标记,而应用也同时运行。应用在运行的过程中可能改变了对某些对象的引用,这使得同步标记阶段中并不能保证所有的被引用对象进行了标记,也导致了必须 需要进行的第三个阶段-“再标记”。在再标记阶段中将会使应用进入第二个暂停,利用这个暂停时间同步收集器将完成对所有对象的标记。可以看出在再标记的过 程中使用了并行的方式,所以这部分标记的对象的数量要比在初始阶段中标记完成的多。在最后一个阶段同步收集器将会把前几个阶段中标记出来的“老生代”中的 垃圾对象进行清除。但是不会将被引用的对象放在一个连续的空间中(见图10,橙色为垃圾对象,绿色为收集后的空闲空间)。可以看出“老生代”中的可用空间 并不是连续的,这个会导致将为提升到“老生代”的对象分配空间时需要工多的时间和资源。
图10:“老生代”中的同步清除
与串行收集器和并行收集器相比较同步收集器会有下面几个特点。
1) 要求分配到的堆大;
2 )对不连续空间的使用效率低;
3 )在某些情况下能够显著缩短主收集使应用停顿的时间。
附录A:参考文献
JVM Specification 第二版
http://java.sun.com/docs/books/vmspec/2nd-edition/html/VMSpecTOC.doc.html
分享到:
评论

相关推荐

    JVM-HotSpot-原理

    • HotSpot • ClassFile • ClassLoader • 内存模型、锁、同步 • JVM内存管理和垃圾收集 Java发展历程 JVM列表 OpenJDK 编译执行过程 解析执行和JIT编译

    HotSpot实战高清版本

    垃圾收集器的设计演进、CMS 和 G1 收集器、栈、JVM 对硬件寄存器的利用、栈顶缓存技术、解释器、字节 码表、转发表、Stubs、Code Cache、Code 生成器、JIT 编译器、C1 编译器、编译原理、JVM 指令集实现、函 ...

    Java垃圾收集基础知识-官方版本

    本教程介绍了垃圾收集如何与Hotspot JVM一起使用的基础知识。了解垃圾收集器的工作原理后,学习如何使用Visual VM监视垃圾收集过程。最后,了解Java SE 7 Hotspot JVM中可用的垃圾收集器。

    HotSpot实战

    包括OpenJDK与HotSpot项目、编译和调试HotSpot的方法、HotSpot内核结构、Launcher、OOP-Klass对象表示系统、链接、运行时数据区、方法区、常量池和常量池Cache、Perf Data、Crash分析方法、转储分析方法、垃圾收集器...

    JVM-Java虚拟机

    能学到什么:1,JVM底层运行机制和原理;2JVM参数;3,垃圾回收原理;4,垃圾回收器的使用;5,调优实战案例 导语:平时我们所说的JVM广义上指的是一种规范。狭义上的是JDK中的JVM虚拟机。JVM的实现是由各个厂商来做...

    JVM基础教程

    有关JVM的基础教程。介绍JVM原理:hotspot、classfile、classloader、内存模型、锁、同步、JVM内存管理和垃圾收集。

    JAVA虚拟机精讲 pdf

    本书以极其精练的语句诠释了HotSpot VM 的方方面面,比如:字节码的编译原理、字节码的内部组成结构、通过源码的方式剖析HotSpot VM 的启动过程和初始化过程、Java 虚拟机的运行时内存、垃圾收集算法、垃圾收集器...

    JVM 知识点整理:GC垃圾收集器及相关算法

    JVM 知识点整理:GC垃圾收集器判断哪些对象需要回收引用计数器算法可达性分析算法引用还有分类(了解)“缓刑” finalize(了解)开始垃圾收集标记 – 清除算法复制算法标记 – 整理算法分代收集算法HotSpot 算法...

    JAVA虚拟机精讲

    《Java虚拟机精讲》以极其精练的语句诠释了HotSpot VM 的方方面面,比如:字节码的编译原理、字节码的内部组成结构、通过源码的方式剖析HotSpot VM 的启动过程和初始化过程、Java 虚拟机的运行时内存、垃圾收集算法...

    java虚拟机精讲(电子工业出版社出版)

    本书以极其精练的语句诠释了 HotSpot VM的方方面面,比如:字节码的编译原理、字节码的内部组成结构、通过源码的方式剖析 HotSpot VM 的启动过程和初始化过程、Java 虚拟机的运行时内存、垃圾收集算法、垃圾收集器...

    Java虚拟机精讲.高翔龙.带书签完整版.pdf

    本书以极其精练的语句诠释了HotSpot VM 的方方面面,比如:字节码的编译原理、字节码的内部组成结构、通过源码的方式剖析HotSpot VM 的启动过程和初始化过程、Java 虚拟机的运行时内存、垃圾收集算法、垃圾收集器...

    Java虚拟机

    常见的垃圾收集算法以及垃圾收集器的特点和工作原理;常见虚拟机监控与故障处理工具的原理和使用方法。第三部分分析了虚拟机的执行子系统,包括类文件结构、虚拟机类加载机制、虚拟机字节码执行引擎。第四部分讲解了...

    java面试题

    Bea JRockit JVM支持4种垃圾收集器: 46 63.5. 如何从JVM中获取信息来进行调整 46 63.6. Pdm系统JVM调整 47 63.6.1. 服务器:前提内存1G 单CPU 47 63.6.2. 客户机:通过在JNLP文件中设置参数来调整客户端JVM 47 64....

Global site tag (gtag.js) - Google Analytics