对象在 JVM 中是怎么存储的

对象头里有什么?

文章收录在 GitHub JavaKeeper ,N线互联网开发必备技能兵器谱,有你想要的。

作为一名 Javaer,生活中的我们可能暂时没有对象,但是工作中每天都会创建大量的 Java 对象,你有试着去了解下自己的“对象”吗?

我们从四个方面重新认识下自己的“对象”

  1. 创建对象的 6 种方式
  2. 创建一个对象在 JVM 中都发生了什么
  3. 对象在 JVM 中的内存布局
  4. 对象的访问定位
一、创建对象的方式二、创建对象的步骤

这里讨论的仅仅是普通 Java 对象,不包含数组和 Class 对象(普通对象和数组对象的创建指令是不同的。创建类实例的指令:new,创建数组的指令:newarray,anewarray,multianewarray)

1. new指令

虚拟机遇到一条 new 指令时,首先去检查这个指令的参数是否能在 Metaspace 的常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过(即判断类元信息是否存在)。如果没有,那么须在双亲委派模式下,先执行相应的类加载过程。

2. 分配内存

接下来虚拟机将为新生代对象分配内存。对象所需的内存的大小在类加载完成后便可完全确定。如果实例成员变量是引用变量,仅分配引用变量空间即可,即 4 个字节大小。分配方式有“ 指针碰撞 (Bump the Pointer)”和“ 空闲列表 (Free List)”两种方式,具体由所采用的垃圾收集器是否带有压缩整理功能决定。

我们都知道堆内存是线程共享的,那在分配内存的时候就会存在并发安全问题,JVM 是如何解决的呢?

一般有两种解决方案:

  1. 对分配内存空间的动作做同步处理,采用 CAS 机制,配合失败重试的方式保证更新操作的原子性
  2. 每个线程在 Java 堆中预先分配一小块内存,然后再给对象分配内存的时候,直接在自己这块"私有"内存中分配,当这部分区域用完之后,再分配新的"私有"内存。这种方案称为 TLAB (Thread Local Allocation Buffer),这部分 Buffer 是从堆中划分出来的,但是是本地线程独享的。这里值得注意的是,我们说 TLAB 是线程独享的,只是在“分配”这个动作上是线程独占的,至于在读取、垃圾回收等动作上都是线程共享的。而且在使用上也没有什么区别。另外,TLAB 仅作用于新生代的 Eden Space,对象被创建的时候首先放到这个区域,但是新生代分配不了内存的大对象会直接进入老年代。 因此在编写 Java 程序时,通常多个小的对象比大的对象分配起来更加高效。虚拟机是否使用 TLAB 是可以选择的,可以通过设置 -XX: /-UseTLAB 参数来指定,JDK8 默认开启。
3. 初始化

内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),这一步操作保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。如:byte、short、long 转化为对象后初始值为 0,Boolean 初始值为 false。

4. 对象的初始设置(设置对象的对象头)

接下来虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前的运行状态的不同,如对否启用偏向锁等,对象头会有不同的设置方式。

5. <init>方法初始化

在上面的工作都完成了之后,从虚拟机的角度看,一个新的对象已经产生了,但是从 Java 程序的角度看,对象创建才刚刚开始,<init>方法还没有执行,所有的字段都还为零。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的地址赋值给引用变量。

所以,一般来说,执行 new 指令后接着执行 init 方法,把对象按照程序员的意愿进行初始化(应该是将构造函数中的参数赋值给对象的字段),这样一个真正可用的对象才算完全产生出来。

三、对象的内存布局

在 HotSpot 虚拟机中,对象在内存中存储的布局可以分为 3 块区域:对象头(Header)、实例数据(Instance Data)、对其填充(Padding)。

对象头

HotSpot 虚拟机的对象头包含两部分信息。

如果对象是一个 Java 数组,那在对象头中还必须有一块用于记录数组长度的数据。

元数据:描述数据的数据。对数据及信息资源的描述信息。在 Java 中,元数据大多表示为注解。

实例数据

实例数据部分是对象真正存储的有效信息,也是在程序代码中定义的各种类型的字段内容,无论从父类继承下来的,还是在子类中定义的,都需要记录起来。这部分的存储顺序会受虚拟机默认的分配策略参数和字段在 Java 源码中定义的顺序影响(相同宽度的字段总是被分配到一起)。

规则:

对齐填充

对齐填充部分并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于 HotSpot VM 的自动内存管理系统要求对象的起始地址必须是 8 字节的整数倍,也就是说,对象的大小必须是 8 字节的整数倍。而对象头部分正好是 8 字节的倍数(1倍或者2倍),因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

我们通过一个简单的例子加深下理解

public class PersonObject { public static void main(String[] args) { Person person = new Person(); } }

public class Person { int id = 1008; String name; Department department; { name = "匿名用户"; //name赋值为字符串常量 } }

public class Department { int id; String name; }

初学java 你们有什么体会(你有认真了解过自己的)(1)

四、对象的访问定位

我们创建对象的目的,肯定是为了使用它,那 JVM 是如何通过栈帧中的对象引用访问到其内存的对象实例呢?

由于 reference 类型在 Java 虚拟机规范里只规定了一个指向对象的引用,并没有定义这个引用应该通过哪种方式去定位,以及访问到 Java 堆中的对象的具体位置,因此不同虚拟机实现的对象访问方式会有所不同,主流的访问方式有两种:

,