查看原文
其他

被 Java 垃圾回收机制 给跪了

任玉刚 开发者技术前线 2019-05-24

点击上方开发者技术前线”,选择“置顶或者星标”

你关注的就是我关心的!


Java的垃圾回收机制一直是面试中的热点,很多人对此不清楚。其实对于这块内容我们也不需要掌握太深,通过本文的介绍大家能在面试中吹吹牛逼就够了。另外,接下来会有一篇内存泄露的文章,本文也是为其做铺垫。

在c/c++中,需要手动去释放内存,这是一件很麻烦的事,很容易就出现内存泄露等问题了。在Java中,由JVM提供了垃圾回收机制,因此我们可以只关注对象的创建即可,无需关心对象不用时的回收问题。但是,由于我们写代码时的不规范等,同样也会造成内存泄露。因此,我们可以通过了解垃圾回收机制的原理来揭开内存泄露的原因。

1. 判断哪些对象是垃圾

垃圾收集器在进行回收之前,需要判断哪些对象是无用的,能够进行回收的。判断无用对象有两种算法:一种是引用计数算法,另一种是可达性分析算法。

1.1 引用计数算法

引用计数算法实际很简单:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加1;当引用失效时,计数器减1;任何时刻计数器都为0的对象就是不可能再被使用的。

但是,引用计数算法有一个缺陷,就是无法解决对象之间相互循环引用的问题。比如:对象objAobjB都有字段instance,赋值令objA.instance=objBobjB.instance=objA,除此之外这两个对象再无任何引用,实际上这两个对象都已经不能再被访问,但是它们因为相互引用着对方,所以它们的引用计数都不为0,于是如果是使用引用计数算法的话GC收集器就不会回收它们。代码如下所示:

public class ReferenceCountingGC {

    private ReferenceCountingGC instance = null;

    public static void main(String[] args) {
        ReferenceCountingGC objA = new ReferenceCountingGC();
        ReferenceCountingGC objB = new ReferenceCountingGC();

        objA.instance = objB;
        objB.instance = objA;

        objA = null;
        objB = null;

        System.gc();
    }
}

所以,主流的Java虚拟机都不使用引用计数算法来管理内存。

1.2 可达性分析算法

这个算法的基本思路就是通过一系列的称为GC Roots的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。如下图所示,对象object 5object 6object 7虽然互相有关联,但是它们到GC Roots是不可达的,所以它们将会被判定为是可回收的对象。

可达性分析算法.jpg

在Java语言中,可作为GC Roots的对象包括下面几种:

1.虚拟机栈(栈帧中的本地变量表)中引用的对象。
2.方法区中类静态属性引用的对象。
3.方法区中常量引用的对象。
4.本地方法栈中JNI(即一般说的Native方法)引用的对象。

内存泄露就是无用的对象给其他地方意外的持有,导致其是可达的,因此判定它不是可回收的对象。

2. JVM堆模型/分代

JVM将堆分成了二个大区新生代(Young)和老年代(Old),新生代又被进一步划分为EdenSurvivor区,而SurvivorFromSpaceToSpace组成,也有些人把FromSpaceToSpace叫成Survivor1Survivor2
如下图所示:

堆空间.png

为什么新生代还要分成三块呢?这是因为新生代中98%的对象都是朝生夕死,所以将内存分为一块较大的Eden和两块较小的Survivor1Survivor2,JVM默认分配是8:1:1,每次使用Eden和其中的Survivor1FromSpace),当发生回收的时候,将EdenSurvivor1FromSpace)存活的对象复制到Survivor2ToSpace),然后直接清理掉EdenSurvivor1的空间。

  • 新生代
    新创建的对象都是在新生代分配内存,Eden空间不足时,触发Minor GC,这时会把存活的对象转移进Survivor区。

  • 老年代
    老年代用于存放经过多次Minor GC之后依然存活的对象。

  • 新生代的GC(Minor GC
    新生代通常存活时间较短,其基于复制算法进行回收。复制算法就是扫描出存活的对象,然后复制到一块新的完全未使用的空间中,对应于新生代,就是在EdenFromSpaceToSpace之间复制。新生代采用空闲指针的方式来控制GC触发,指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从EdenSurvivor,最后到老年代。

  • 老年代的GC(Major GC/Full GC
    老年代与新生代不同,老年代对象存活的时间比较长、比较稳定,因此采用标记(Mark)算法来进行回收,所谓标记就是扫描出存活的对象,然后再进行回收未被标记的对象,回收后对用空出的空间要么进行合并、要么标记出来便于下次进行分配,总之目的就是要减少内存碎片带来的效率损耗。

3. 垃圾收集算法

这里只介绍几种算法的思想,不涉及具体的算法实现。

3.1 标记-清除算法

标记-清除算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

标记-清除算法是最基础的收集算法,其他的收集算法都是基于这种思路并对其不足进行改进而得到的。

  • 标记-清除算法的不足
    一个是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

标记-清除算法执行过程如下图所示:

标记-清除算法.png

3.2 复制算法

将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

只是这种算法的代价是将内存缩小为了原来的一半,未免太高了一点。

复杂算法的执行过程如下:

复制算法.png

新生代的回收都是基于复制算法来实现,只是会进行优化,具体可以看下前面 新生代的GC 这一块的内容。

3.3 标记-整理算法

标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。如下图所示:

标记-整理算法.png

3.4 分代收集算法

目前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,根据对象存活周期的不同将内存划分为几块。

把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。

在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。

而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记—清理”或者“标记—整理”算法来进行回收。

— — — END — — —

转载声明:本文转载自「玉刚说」,搜索即可关注。

想加我交流的请后台回复“联系方式”

加群请回复“加群”  拓展知识面可后台回复“ 淘金”。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存