JVM学习--Java内存管理&&异常

概述

按技术体系

	JAVA CARD:支持一些java小程序运行在小内存设备
	
	JAVA ME:支持java程序运行在移动终端
	
	JAVA SE:支持面向桌面级应用的java平台
	
	JAVA EE:支持使用多层架构的企业应用

未来趋势

模块化+混合语言+多核并行+进一步丰富的语法

数据区域

在这里插入图片描述

程序计数器(PCR)

  • 作用:
    当前线程所执行的字节码的行号指示器,字节码解释器工作时通过改变计数器的值来选取下一条需要执行的字节码指令

  • 由于JVM的多线程通过线程轮流切换并分配处理器执行时间来实现的,故在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令,每条线程都需要有一个独立的程序计数器,各条线程之间的程序计数器互不影响,相互独立。这类内存区域称之为"线程私有"的内存

  • 若线程执行的是java方法,则记录正在执行的虚拟机字节码指令的地址;
    若线程执行的Natvie方法,则该计数器的值为空

栈(Stack)

java虚拟机栈

  • 线程私有,生命周期与线程一致

  • 存放JVM中的局部变量表部分

    局部变量表存放了编译期克制的各种基本数据类型(boolean,byte,int,char,short,long,float,double)、对象引用(reference类型)、returnAddress类型(指向了一条字节码指令的地址)
    long和double会占用俩个局部变量空间,其余的只占用一个
    方法运行期间不会改变局部变量表的大小

  • 俩种异常
    StackOverflowError
    线程请求的栈深度大于虚拟机所允许的深度
    OutOfMemoryError
    JVM可以动态扩展,当扩展时无法申请到足够的内存

本地方法栈

为虚拟机使用到的Native方法服务

堆(Heap)

  • 特点:

所有线程共享的一块内存区域
在虚拟机启动时创建
存放对象实例,几乎所有的对象实例都在这里分配内存
可以是物理上不连续的内存空间,在逻辑上连续即可

  • java堆是垃圾收集器管理的主要区域,很多时候也成为GC堆

从内存回收的角度来看,java堆可细分为:新生代和老年代
从内存分配的角度来看,java堆可划分出多个线程私有的分配缓冲区

  • 当堆中没有内存完成实例分配,并且无法再扩展的时候,将会抛出OutOfMemoryError异常

方法区(MA)

-特点:

各个线程共享的内存区域,用于存放已经JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据
可以是物理上不连续的内存空间,在逻辑上连续即可
可选择固定大小,也可扩展
可选择不实现垃圾收集

  • 内存的回收目标主要是针对常量池的回收和对类型的卸载
  • 当方法区中无法满足内存分配需求,将会抛出OutOfMemoryError异常

运行时常量池(RCP)

  • 方法区的一部分,用于存放编译期生成的各种字面量和符号引用,在类加载后存放到方法区的运行时的常量池中
  • 相对于Class文件的常量池的区别是运行时常量池具备动态性
  • 当RCP无法再胜青岛内存你是,将会抛出OutOfMemoryError异常

直接内存

并非JVM运行时的数据区的一部分,也不是JVM规范中的定义的内存区域
JDK1.4中新加入NIO类,引入了一种基于通道与缓冲区的I/O方式,可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为引用进行操作,提高性能

HotSpot虚拟机

对象的创建

类加载检查

当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到
一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那 必须先执行相应的类加载过程,

分配内存

对象所需要得内存在类加载完成后即可确定
分配方式:
1、指针碰撞(BTP)
JAVA堆中的内存是绝对规整的,所有被使用过的内存都放在一起,空闲的内存放在另一边,中间是一个指针作为分界点的指示器
2、空闲列表(FL)
JAVA堆中的内存是不规整的,已被使用的内存和空闲的内存相互交错在一起,虚拟机必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录

如何保证线程安全?

  • 对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性;
  • 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local AllocationBuffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。

执行构造函数

HotSpot解释器代码片段

// 确保常量池中存放的是已解释的类
if (!constants->tag_at(index).is_unresolved_klass()) {
// 断言确保是klassOop和instanceKlassOop(这部分下一节介绍)
oop entry = (klassOop) *constants->obj_at_addr(index);
assert(entry->is_klass(), "Should be resolved klass");
klassOop k_entry = (klassOop) entry;
assert(k_entry->klass_part()->oop_is_instance(), "Should be instanceKlass");
instanceKlass* ik = (instanceKlass*) k_entry->klass_part();
// 确保对象所属类型已经经过初始化阶段
if ( ik->is_initialized() && ik->can_be_fastpath_allocated() ) {
// 取对象长度
size_t obj_size = ik->size_helper();
oop result = NULL;
// 记录是否需要将对象所有字段置零值
bool need_zero = !ZeroTLAB;
// 是否在TLAB中分配对象
if (UseTLAB) {
result = (oop) THREAD->tlab().allocate(obj_size);
}
if (result == NULL) {
need_zero = true;
// 直接在eden中分配对象
retry:
HeapWord* compare_to = *Universe::heap()->top_addr();
HeapWord* new_top = compare_to + obj_size;
// cmpxchg是x86中的CAS指令,这里是一个C++方法,通过CAS方式分配空间,并发失败的
话,转到retry中重试直至成功分配为止
if (new_top <= *Universe::heap()->end_addr()) {
if (Atomic::cmpxchg_ptr(new_top, Universe::heap()->top_addr(), compare_to) != compare_to) {
goto retry;
}
result = (oop) compare_to;
}
}
if (result != NULL) {
// 如果需要,为对象初始化零值
if (need_zero ) {
HeapWord* to_zero = (HeapWord*) result + sizeof(oopDesc) / oopSize;
obj_size -= sizeof(oopDesc) / oopSize;
if (obj_size > 0 ) {
memset(to_zero, 0, obj_size * HeapWordSize);
}
}
// 根据是否启用偏向锁,设置对象头信息
if (UseBiasedLocking) {
result->set_mark(ik->prototype_header());
} else {
result->set_mark(markOopDesc::prototype());
}
result->set_klass_gap(0);
result->set_klass(k_entry);
// 将对象引用入栈,继续执行下一条指令
SET_STACK_OBJECT(result, 0);
UPDATE_PC_AND_TOS_AND_CONTINUE(3, 1);
}
}
}

对象的内存布局

对象头(Header)

一、存储对象自身的运行时数据
这部分主要用来存储对象自身的运行时数据,如hashcode、gc分代年龄等。mark word的位长度为JVM的一个Word大小,也就是说32位JVM的Mark word为32位,64位JVM为64位。
为了让一个字大小存储更多的信息,JVM将字的最低两个位设置为标记位,不同标记位下的Mark Word示意如下:
在这里插入图片描述
lock:2位的锁状态标记位,由于希望用尽可能少的二进制位表示尽可能多的信息,所以设置了lock标记。该标记的值不同,整个mark word表示的含义不同。
在这里插入图片描述
biased_lock:对象是否启用偏向锁标记,只占1个二进制位。为1时表示对象启用偏向锁,为0时表示对象没有偏向锁。
age:4位的Java对象年龄。在GC中,如果对象在Survivor区复制一次,年龄增加1。当对象达到设定的阈值时,将会晋升到老年代。默认情况下,并行GC的年龄阈值为15,并发GC的年龄阈值为6。由于age只有4位,所以最大值为15,这就是-XX:MaxTenuringThreshold选项最大值为15的原因。
identity_hashcode:25位的对象标识Hash码,采用延迟加载技术。调用方法System.identityHashCode()计算,并会将结果写到该对象头中。当对象被锁定时,该值会移动到管程Monitor中。
thread:持有偏向锁的线程ID。
epoch:偏向时间戳。
ptr_to_lock_record:指向栈中锁记录的指针。
ptr_to_heavyweight_monitor:指向管程Monitor的指针

二、类型指针
指向它的类型元数据的指针

实例数据(Instance Data)

是对象真正存储的有效信息,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的字段都必须记录起来。
这部分的存储顺序会受到虚拟机分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中定义顺序的影响。
HotSpot虚拟机默认的分配顺序为longs/doubles、ints、shorts/chars、bytes/booleans、oops(OrdinaryObject Pointers,OOPs),从以上默认的分配策略中可以看到,相同宽度的字段总是被分配到一起存放,在满足这个前提条件的情况下,在父类中定义的变量会出现在子类之前。如果HotSpot虚拟机的+XX:CompactFields参数值为true(默认就为true),那子类之中较窄的变量也允许插入父类变量的空隙之中,以节省出一点点空间。

对齐填充(Padding)

这并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作
用。由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

访问定位

使用句柄

Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
在这里插入图片描述

使用指针

Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。
在这里插入图片描述

区别

使用句柄来访问的最大好处就是reference中存储的是稳定句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要被修改。

使用直接指针来访问最大的好处就是速度更快,它节省了一次指针定位的时间开销,由于对象访
问在Java中非常频繁,因此这类开销积少成多也是一项极为可观的执行成本。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章