首页 JVM虚拟机 - 类的加载、连接、初始化
文章
取消

JVM虚拟机 - 类的加载、连接、初始化

类的加载、连接、初始化

在Java代码中,类型的加载、连接和初始化过程都是在程序运行期间完成的

由此提供了更大的灵活性以及更多的可能性

  • 加载:查找并加载二进制类
  • 连接
    • 验证:确保加载类的正确性
      • 类文件的结构检测
      • 语义检测
      • 字节码验证
      • 二进制兼容性检测
    • 准备:为类的静态变量分配内存,并将其初始化为默认值。例如有static int a=1,其中int类型的默认值为0,则a的值为0
    • 解析:把类中的符号引用转换为直接引用,类之间的引用采用指针的方式直接指定
  • 初始化:为静态变量赋予正确的初始值例如将前面的a复制为1。所有的Java虚拟机实现必须在每个类或接口被Java程序“首次主动使用”才会初始化他们
  • 类的使用
    • 主动使用(类实例化)
    • 被动使用
  • 垃圾回收和对象终结
  • 类卸载

类的加载

定义

类的加载是指将类的.class文件的二进制数据读入到内存中,将其放在运行时数据的方法区内,然后在内存中创建一个java.lang.Class对象(规范并未说Class对象放在哪,HotSpSpot虚拟机将其放在方法区中),其中Class对象封装了方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口

JVM规范允许类加载器在预料某个类将要被使用时就预先加载它,如果在预先加载的过程中遇到了.class文件缺失或者存在错误,类加载器必须在程序首次主动使用该类才会抛出错误(LinkageError错误),也就是说如果程序一直没主动使用该类,则类加载器就不会报错

ps:与初始化不同,类的加载并不需要等到某个类被“首次主动使用”时才加载他

加载的流程

加载时类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:

  • 通过一个类的全限定名来获取其定义的二进制字节流。
  • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
  • 在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口。

加载器

一共存在两类类加载器

  • Java虚拟机自带的加载器
    • 根类加载器(BootStrap)
    • 拓展类加载器(Extension)
    • 系统(应用)类加载器(System)
  • 用户自定义加载器
    • java.lang.ClassLoader的子类
    • 用户可以自定义类的加载方式

类的加载方式

  • 从本地系统中直接加载
  • 通过网络下载.class文件
  • 从zip、jar等归档文件中加载.class文件
  • 从转有的数据库中提取.class文件
  • 将java源文件动态编译为.class文件(动态代理)

连接

验证:确保被加载的类的正确性

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成4个阶段的检验动作:

  • 文件格式验证: 验证字节流是否符合Class文件格式的规范;例如: 是否以0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。
  • 元数据验证: 对字节码描述的信息进行语义分析(注意: 对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如: 这个类是否有父类,除了java.lang.Object之外。
  • 字节码验证: 通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。
  • 符号引用验证: 确保解析动作能正确执行。

验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。

准备:为类的静态变量分配内存,并将其初始化为默认值

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:

  • 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。
  • 这里所设置的初始值通常情况下是数据类型默认的零值(如00Lnullfalse等),而不是被在Java代码中被显式地赋予的值。

假设一个类变量的定义为: public static int value = 3;那么变量value在准备阶段过后的初始值为0,而不是3,因为这时候尚未开始执行任何Java方法,而把value赋值为3的put static指令是在程序编译后,存放于类构造器<clinit>()方法之中的,所以把value赋值为3的动作将在初始化阶段才会执行。

解析:把类中的符号引用转换为直接引用

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对接口字段类方法接口方法方法类型方法句柄调用点限定符7类符号引用进行。符号引用就是一组符号来描述目标,可以是任何字面量。

直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

类的初始化

在初始化阶段,Java虚拟机执行类的初始化语句,为类的静态变量赋初值。在程序中,静态变量的初始化有两种途径:(1)在静态变量声明处进行初始化;(2)在静态代码块中初始化

类的主动使用

  • 创建类的实例。例如,new Object(),但是声明对象不会
    • 为实例的对象分配内存
    • 为实例的变量赋默认值
    • 为实例变量赋正确的初始值(此过程与初始化过程差不多)
  • 访问某个类的静态方法,或者对改静态方法复制
  • 调用某类的静态方法
  • 反射,例如,Class.forName("com.test.Test")
  • 初始化一个类的子类
  • Java虚拟机启动时被标明为启动类的类
  • JDK1.7开始提供动态语言支持:java.lang.invoke.MethodHandle实例的解析结果REF_getStatic,REF_putStatic,REF_invokeStatic句柄对应的类没有初始化,则初始化

除了以上7种情况,其他使用Java类的方式均被看作类的被动使用,都不会导致类的初始化

几种特殊情况

  • 情形一

通过子类对象调用父类的静态变量,并未主动使用子类,子类的静态代码块不会被初始化,但是此种情况依然会加载MySon.class文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public class MyTest1 {
    public static void main(String[] args) {
        System.out.println(MySon.str);
    }
}
class MyParent{
    public static String str = "it's parent obj";
    static {
        System.out.println("hello world");
    }
}
class MySon extends MyParent{
    static {
        System.out.println("hello world son");
    }
}
  • 情形二

将MyParen类修改中str字符串添加final修饰符,则MyParent和MySon均不会被加载也不会被初始化,也不会被加载

1
2
3
4
5
6
7
8
9
10
11
12
13
public class MyTest1 {
    public static void main(String[] args) {
        System.out.println(MySon.str);
        System.out.println(MyParent.uuid);
    }
}
class MyParent{
    public static final String str = "it's parent obj";
    public static final String uuid = UUID.randomUUID().toString();
    static {
        System.out.println("hello world");
    }
}

原因:final修饰的常量在编译阶段会存入调用这个常量的类的常量池中,本质上调用类并没有直接引用到定义常量的类,因此并不会触发定义常量的类的初始化。但是如果是使用的UUID.randomUUID()这样的变量,还是会初始化该对象

  • 情形三

初始化某个对象的数组并不会导致该类被初始化

1
2
3
4
5
6
7
8
9
10
11
12
13
public class MyTest3 {
    public static void main(String[] args) {
        MyParent3[][] myParent3s = new MyParent3[4][4];
        System.out.println(myParent3s.getClass());
    }
}
class MyParent3{
    static {
        System.out.println("hello world");
    }
}
//结果
//class [[Lvideo_lecture.classloader.MyParent3;

从打印的类来看,Java虚拟机在运行时会生成一个数组类型的类,如果是二维数组,则class名含有两个[[`

  • 情形四

当一个接口初始化时,并不要求其父类接口都完成初始化

只有当真正使用到父接口的时候(如引用接口所定义的常量时),才会初始化

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
public class MyTest4 {
    public static void main(String[] args) {
        /*并不会打印"im parent4",但是将interface改为class时会打印*/
        System.out.println(MySon4.t2);
    }
}
interface MyParent4{
    public static final Thread t1 = new Thread(){
        {
            System.out.println("im parent4");
        }
    };
}
interface MySon4 extends MyParent4{
    public static final Thread t2 = new Thread(){
        {
            System.out.println("im son4");
        }
    };
}
  • 情形五

ClassLoader类的loadClass并不会导致类的主动使用,也就是并不会导致类的初始化

但是Class.forName(),即反射是会导致类的主动使用的

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public class MyTest6 {
    public static void main(String[] args) throws ClassNotFoundException {
        final ClassLoader loader = ClassLoader.getSystemClassLoader();
        Class<?> clazz = loader.loadClass("video_lecture.classloader.CL");
        System.out.println(clazz);
        System.out.println("----------------");
        clazz = Class.forName("video_lecture.classloader.CL");
        System.out.println(clazz);
    }
}
class CL{
    static {
        System.out.println("im static block");
    }
}

类的使用

类访问方法区内的数据结构的接口, 对象是Heap区的数据。

类的卸载

Java虚拟机将结束生命周期的几种情况

  • 执行了System.exit()方法
  • 程序正常执行结束
  • 程序在执行过程中遇到了异常或错误而异常终止
  • 由于操作系统出现错误而导致Java虚拟机进程终止

助记符

ldc:int、float、String类型常量值从常量池中推送至栈顶

bipush:将单字节(-128~127)的常量值推送至栈顶

sipush:表示将一个短整型常量值( -32768-32767)推送至栈顶

iconst_m1-iconst_5:将-1-5推送至栈顶(一共7个)

参考

本文由作者按照 CC BY 4.0 进行授权

设计模式 - 行为型模式

Flink - Flink架构概述