JVM 【垃圾回收算法和种类】

2018年7月7日 作者 jacky
  • GC的概念
  • GC算法
    • 引用计数法
    • 标记清除
    • 标记压缩
    • 复制算法
  • 可触及性
  • Stop-The_World

引用计数法

  • 老牌垃圾回收算法
  • 通过引用计算来回收垃圾
  • 使用者
    • COM
    • ActionScript3
    • Python

引用计数器的实现很简单,对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器就加1,当引用失效时,引用计数器就减1。只要对象A的引用计数器的值为0,则对象A就不可能再被使用。

引用计数法的问题

  • 引用和去去引用伴随加法和减法,影响性能
  • 很难处理循环利用

标记-清除

标记-清除算法是现代垃圾回收算法的思想基础。标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段,首先通过根节点,标记所有从根节点开始的可达对象。因此,未被标记的对象就是未被引用的垃圾对象。然后,在清除阶段,清除所有未被标记的对象。

标记-压缩

标记-压缩算法适合用于存活对象较多的场合,如老年代。它在标记-清除算法的基础上做了一些优化。和标记-清除算法一样,标记-压缩算法也首先需要从根节点开始,对所有可达对象做一次标记。但之后,它并不简单的清理未标记的对象,而是将所有的存活对象压缩到内存的一端。之后,清理边界外所有的空间

问题 : 标记压缩和标记清除而言,有什么优势呢?
标记压缩是对标记清除算法的一种改良

复制算法

  • 与标记-清除算法相比,复制算法是一种相对高效的回收方法
  • 不适用于存活对象较多的场合 如老年代
  • 将原有的内存空间分为两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中的存活对象复制到未使用的内存块中,之后,清除正在使用的内存块中的所有对象,交换两个内存的角色,完成垃圾回收

  • 复制算法的最大的问题是: 空间浪费,只能使用一半的空间 整合标记清理思想

改良的思路:

  • 首先复制空间是很少的,大对象是不能往复制空间放的,一是如果大对象往复制空间里面放,里面很多小对象都需要移动,二是复制空间根本放不下大对象,此时需要有一块空间为大对象做担保,老年代就是为大对象担保
  • 老年对象进入老年代,经过多次复制算法的回收,对象都没有清除,此时,对象就会放进老年代了
  • 经过以上的步骤,将大对象和老年对象都放进了老年代,开始复制算法,s1的存活对象复制到s2,清除s2

新生代 = eden + from + to
新生代的大小大约为 13M

分代思想

  • 依据对象的存活周期进行分类,短命对象归为新生代,长命对象归为老年代。
  • 根据不同代的特点,选取合适的收集算法
    • 少量对象存活,适合复制算法,新生代的空间是比较小的,适合使用复制算法
    • 大量对象存活,适合标记清理或者标记压缩,老年代的对象一是通过担保的方式进来的,一是通过多次回收都没有清除的方式进来的,所以老年代肯定是有着大量的存活对象和大对象,适合标记清除和标记压缩

GC算法总结整理

  • 引用计数
    • 没有被Java采用
  • 标记-清除
  • 标记-压缩
  • 复制算法
    • 新生代

所有的算法,需要能够识别一个垃圾对象,因此需要给出一个可触及性的定义

可触及性(可达性分析)

  • 可触及的
    • 从根节点可以触及到这个对象
    • 不可以回收的
  • 可复活的
    • 一旦所有引用被释放,就是可复活状态
    • 因为在finalize()中可能复活该对象
    • 此时对象虽然是不可达的,但是也是不可以回收的
  • 不可触及的
    • 在finalize()后,可能会进入不可触及状态
    • 不可触及的对象不可能复活
    • 可以真正的回收
public class CanReliveObj {
    public static CanReliveObj obj;
    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.out.println("CanReliveObj finalize called");
        obj=this;
    }
    @Override
    public String toString(){
        return "I am CanReliveObj";
    }

public static void main(String[] args) throws InterruptedException{
    obj=new CanReliveObj();
    obj=null;   //可复活
    System.gc();
    Thread.sleep(1000);
    if(obj==null){
        System.out.println("obj 是 null");
    }else{
        System.out.println("obj 可用");
    }
    System.out.println("第二次gc");
    obj=null;    //不可复活
    System.gc();
    Thread.sleep(1000);
    if(obj==null){
        System.out.println("obj 是 null");
    }else{
    System.out.println("obj 可用");
    }
}

CanReliveObj finalize called
obj 可用
第二次gc
obj 是 null

finalize使用建议

  • 经验:避免使用finalize(),操作不慎可能导致错误。
  • finalize()优先级低,何时被调用, 不确定
    • 何时发生GC不确定
  • 可以使用try-catch-finally来替代释放资源

什么是根结点

    • 栈中引用的对象
    • 方法区中静态成员或者常量引用的对象(全局对象)
    • JNI方法栈中引用对象

Stop-The-World

Stop-The-World的时候,JNI的方法是可以调用的,但是整个JVM是挂起的状态,不能和应用层面交互,Stop-The—World只能做一件事,就是GC

  • Stop-The-World

    • Java中一种全局暂停的现象
    • 全局停顿,所有Java代码停止,native代码可以执行,但不能和JVM交互
    • 多半由于GC引起,另一些是认为引起的Stop-The—World
      • Dump线程
      • 死锁检查
      • 堆Dump
  • GC时为什么会有全局停顿?

    • 类比在聚会时打扫房间,聚会时很乱,又有新的垃圾产生,房间永远打扫不干净,只有让大家停止活动了,才能将房间打扫干净。
  • 危害

    • 长时间服务停止,没有响应
    • 遇到HA系统,可能引起主备切换,严重危害生产环境。

每秒打印10条

public static class PrintThread extends Thread{
    public static final long starttime=System.currentTimeMillis();
    @Override
    public void run(){
        try{
            while(true){
                long t=System.currentTimeMillis()-starttime;
                System.out.println("time:"+t);
                Thread.sleep(100);
            }
        }catch(Exception e){
            
        }
    }
}