STOP THE WORLD -- JAVA MEMORY and GC

1.简介

　　Java内存模型网上资料一搜一大把，为什么还要写，我的目的是给自己一个总结的机会和查资料不需要四处Google。 STOP THE WORLD! 　　

2.运行时数据区

JVM所管理的内存将包括以下几个Java虚拟机运行时数据区： 1.线程共享： 方法区 Method Area 堆 Heap 2.线程隔离： 虚拟机栈 VM Stack 本地方法栈 Native Method Stack 程序计数器 Program Counter Register 方法区：别名Non-Heap,虽然jvm规范将方法区描述为堆的一个逻辑部分，但是从别名可以看出来并不是一回事。它存储JVM加载的类的信息、常量、静态变量、即时编译器编译后的代码等数据。有时候在HotSpot中，它还跟”永久代”一起提，是因为GC分代扩展到了方法区，或者说使用永久代来实现方法区。 注意：jdk8 hotspot永久代变成了metaspace 堆：JVM中最大的一块内存区域（不然怎么叫面向对象编程呢？），它包含了几乎所有对象的实例（TLAB(Thread-local allocation buffer)和栈上(逃逸分析)也会分配）。现代收集器都是基于分代的收集算法，所以JAVA堆细分为：新生代(Eden+From Survivor+To Survivor)和老年代。 虚拟机栈：如果熟悉C中方法调用时候栈的分配以及执行过程，VM Stack理解下来简直不费力气。方法调用会产生一个栈帧，用来记录局部变量、入参、动态链接地址、返回地址等信息。 本地方法栈：Native方法执行栈，与VM Stack类似。 程序计数器：有点类似汇编中的PC，与C中的下一条执行地址一样，都是用来控制程序执行的流程，实现分支循环跳转异常处理等基础功能的依赖。
直接内存 Direct Memory 直接内存并不是虚拟机运行时数据区的一部分，而不是JVM规范中定义的内存区域，但是这部分在很多地方被使用，所以还是提一下比较好，在JDK1.4中新加入的NIO就使用到这一块的内存，再比如Netty框架中也使用到了，有可能错误的使用方式还是会导致OOME，所以OOME不一定只会在运行时数据区发生，有可能会在Direct Memory中发生。

3.对象的创建

这里仅叙述从new关键字创建的对象，不包括数组和Class对象等。　　
在HotSpot虚拟机中，对象在内存的存储布局可以分为三个区域：对象头(Header)，实例数据(Instance Data)和对齐填充(Padding). 　　
对象的访问定位,如果明白汇编的间接寻址和直接寻址等会很容易理解。

4.对象的死亡

引用计数算法 判断对象是否存活：给对象添加一个引用计数器，每当有一个地方引用了计数器就+1，失效了就-1，只要计数器的值为0就代表对象不可能再被使用。基本上属于实现比较简单、高效，但是有一个致命的缺陷，那就是循环引用问题。
可达性分析算法 从”GC ROOT”出发，向下搜索，当一个对象没有任何引用链和GC ROOT相连（即对象不可达），就说明对象不可能再被使用了。 GC ROOT的对象主要包括：
- 虚拟机栈中引用的对象
- 方法区中类静态属性引用对象
- 方法区中常量引用的对象
- 本地方法栈中Native引用的对象

JDK1.2之后，将JAVA中引用分为：强引用，软引用，弱引用，虚引用。

对象如何做到起死回生

一个对象要真正的死亡，至少要经历两次标记的过程：经过可达性分析没有与GC ROOT相连，那么会进行第一次标记并且进行一次筛选，筛选的条件是此对象是否有必要执行finalize()方法。没必要执行finalize的情况是：没有覆盖finalize方法，已经执行过一次finalize方法。所以要起死回生，逃过一劫的关键就在finalize方法中，我们可以把此对象复制给某变量或者对象的成员变量，从而拯救自己。

5.垃圾收集算法与收集器

垃圾收集算法
- 标记-清除(Mark-Sweep) 标记之后清除，算法简单易实现，缺点是可能产生空间碎片。
- 复制(Copying) 内存分两块，一块用来分配一块用来复制，每次只使用一块，然后将一块的复制到另一块，然后清除。新生代中就是这么做的，当survivor中To 区域不足的时候就需要老年代进行分配担保。
- 标记-整理(Mark-Compact) 标记后将存活对象移动到一端，然后清理剩下的一端。
垃圾收集器
- Serial Serial收集器是最基本、发展历史最悠久的搜集器。Serial是单线程，需要stop the world，但是却是一个简单高效，专心做垃圾收集工作，当可以使stop the world的时间控制在几十毫秒内，都是可以接受这种停顿的。目前为止，它依然是client模式下默认新生代收集器。 新生代采用复制算法，老年代采用标记-整理算法。
- ParNew 是Serial收集器的多线程版，是server模式下首选的新生代收集器。 新生代采用复制算法，老年代采用标记-整理算法。
- Parallel Scavenge 多线程新生代收集器，跟ParNeW差不多，但是更加关注吞吐量，而CMS等关注停顿时间，无法与CMS配合使用。
- Serial Old Serial收集器老年代版本，同样也是单线程。可以配合Parallel Scavenge使用。 新生代采用复制算法，老年代采用标记-整理算法。
- Parallel Old Parallel Scavenge收集器老年代版本，多线程。 新生代采用复制算法，老年代采用标记-整理算法。
- CMS Concurrent Mark Sweep,很明显是采用标记-清除算法，整个过程分为四个步骤：初始标记 -> 并发标记 -> 重新标记 -> 并发清除。 CMS收集器的缺点是：对CPU资源非常敏感，无法处理浮动垃圾，标记-清除算法会产生碎片不利于大对象分配。
- G1 当今收集器技术发展最前沿的成果之一，优点是：并行并发、分代收集、空间整合(标记-整理算法)、可预测的停顿。过程分为四个步骤： 初始标记 -> 并发标记 -> 最终标记 -> 筛选回收。
GC日志 [Full GC 200.231: [ParNew: 261599K->261599K(261952), 0.0000288 secs]] [Full GC是指GC的类型，full gc说明发生了stop the world，[ParNew代表新生代，也可以是PSYoungGen等，根据收集器的不同命名稍微不同， 261599K->261599K(261952)是”GC前该区域已使用容量->GC后该区域已使用容量(该区域总容量)”，最后的小数是GC停顿的时间。当然GC日志 也不止这么简单，但是大致原理是差不多的，都是会标注GC前后内存使用情况，GC所消耗时间，以及GC所发生的时间点。

6.内存分配策略

对象优先在Eden分配，如果启动了本地线程分配缓冲就按线程优先在TLAB上分配，大对象直接进入老年代，长期存活的对象进入老年代。（基本方向是这样的，具体要根据JVM参数设置才能知道） Eden区没有足够的空间时，JVM会发起一次Minor GC，老年代空间不够会发生Full GC，并且会伴随着多次的Minor GC。 对象的年龄如何确定？没经过一次Minor GC年龄就会加一岁，当到达15岁（默认）时就会晋升到老年代。