表格参考来自于 “深入理解Java虚拟机:JVM高级特定及最佳实践”
Class文件结构表
类型 | 名称 | 描述 | 数量 |
---|---|---|---|
u4(4个字节) | magic | 确定该文件是否为一个能被虚拟机接受的Class文件,类似于ID | 1 |
u2(2个字节) | minot_version | 次版本号 | 1 |
u2(2个字节) | mahor_version | 主版本号 | 1 |
u2(2个字节) | constant_pool_count | 常量池容量计数值,从1开始计算,0则表示不引用任何一个常量池项目 | 1 |
cp_info | constant_pool | 常量池 | constant_pool_count-1 |
u2(2个字节) | access_flags | 访问标志 | 1 |
u2(2个字节) | this_class | 类索引 | 1 |
u2(2个字节) | super_class | 父类索引 | 1 |
u2(2个字节) | interfaces_count | 实现接口的数目 | 1 |
u2(4个字节) | interfaces | 接口索引 | interfaces_count |
u2(4个字节) | fields_count | 字段的数目 | 1 |
field_info | fields | 字段内容 | fields_count |
u2(2个字节) | methods_count | 方法的数目 | 1 |
method_info | methods | 方法内容 | methods_count |
u2(2个字节) | attributes_count | 属性的数目 | 1 |
attribute_info | attributes | 属性内容 | attributes_count |
常量表
常量池主要存放两种类型
字面量,包含文本字符串,final的常量值等
符号引用,类和接口的全限定名,字段的名称和描述符,方法的名称和描述符
Class文件只保存各个方法,字段端的信息,不保存内存信息。只有经过运行期转换才能得到真正的内存入口。当虚拟机运行时,需要从常量池中获取到对应的符号引用,再经过类创建或者运行时解析,得到具体的内存地址。
类型 | 子结构 | 标志 | 描述 |
---|---|---|---|
CONSTANT_Utf8_info | tag | u1 = 1 | UTF-8编码的字符串 |
- | lenght | u2 | UTF-8编码的字符串占用的字节数 |
- | bytes | u1 | 长度为lenght的UTF-8编码的字符串 |
CONSTANT_Integer_info | tag | u1=3 | 整型字面量 |
- | bytes | u4 | 按照高位在前存储的int值 |
CONSTANT_Float_info | tag | u1=4 | 浮点型字面量 |
- | bytes | u4 | 按照高位在前存储的float值 |
CONSTANT_Long_info | tag | u1=5 | 长整型字面量 |
- | bytes | u8 | 按照高位在前存储的long值 |
CONSTANT_Double_info | tag | u1=6 | 双精度浮点型字面量 |
- | bytes | u8 | 按照高位在前存储的double值 |
CONSTANT_Class_info | tag | u1=7 | 类或接口的符号引用 |
- | bytes | u2 | 指向全限定名常量项的索引 |
CONSTANT_String_info | tag | u1=8 | 字符串类型字面量 |
- | bytes | u2 | 指向字符串字面量的索引 |
CONSTANT_Fieldref_info | tag | u1=9 | 字段的符号引用 |
- | index | u2 | 指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
- | index | u2 | 指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_Methodred_info | tag | u1=10 | 类中方法的符号引用 |
- | index | u2 | 指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
- | index | u2 | 指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_InterfaceMethodref_info | tag | u1=11 | 接口中方法的符号引用 |
- | index | u2 | 指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
- | index | u2 | 指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_NameAndType_info | tag | u1=12 | 字段或方法的部分符号引用 |
- | index | u2 | 指向该字段或方法名称常量项的索引 |
- | index | u2 | 指向该字段或方法名称常量项的索引 |
CONSTANT_MethodHandle_info | tag | u1=15 | 表示方法句柄 |
- | reference_kind | u1 | 值必须在[1,9]中,它决定了方法句柄的类型。方法句柄类型的值表示方法句柄的字节码行为 |
- | reference_index | u2 | 值必须是对常量池的有效索引 |
CONSTANT_MethodType_info | tag | u1=16 | 识别方法类型 |
- | descriptor_index | u2 | 值必须是对常量池的有效索引,常量池在该索引处的项必须是CONSTANT_Utf8_info结构,表示方法的描述符 |
CONSTANT_InvokeDynamic_info | tag | u1=18 | 表示一个动态方法调用点 |
- | bootstrap_method_attar_index | u2 | 值必须是对当前Class文件中引导方法表的 bootstrap_methods[]数组的有效索引 |
- | name_and_type_index | u2 | 值必须是对当前常量池的有效索引,常量池在该索引处的值必须是CONSTANT_NameAndType_info结构,表示方法名和方法描述符 |
访问标志表
针对类,字段表,方法表中的访问标志进行划分。
类访问标志
用于识别一些类或者接口层次的访问信息, 包括这个Class是类还是接口,是否被定义成public类型,是否被定义成abstract类类型,如果是类的话,是否被声明为final等等
标志名称 | 标志值 | 描述 |
---|---|---|
ACC_PUBLIC | 0x0001 | 是否为public类型 |
ACC_FINAL | 0x0010 | 是否被声明为final,只有类可设置 |
ACC_SUPER | 0x0020 | 是否允许使用invokespecial字节码指令的新语意,invokespecial指令的语意在JDK1.0.2发生过变化,为了区别这条指令使用哪种语意,JDK1.0.2之后编译出来的类的这个标识必须都为真 |
ACC_INTERFACE | 0x0200 | 标识这个是一个接口 |
ACC_ABSTRACT | 0x0400 | 是否为abstract类型,对于接口或者抽象类来说,此标志的值都为真,其他类型为假 |
ACC_SYNTHETIC | 0x1000 | 标识这个类并非由用户代码产生的 |
ACC_ANNOTATION | 0x2000 | 标识这是一个注解 |
ACC_ENUM | 0x4000 | 标识这是一个枚举 |
内部类访问标志
标志名称 | 标志值 | 描述 |
---|---|---|
ACC_PUBLIC | 0x0001 | 内部类是否为public |
ACC_PRIVATE | 0x0002 | 内部类是否为private |
ACC_PROTECTED | 0x0004 | 内部类是否为protected |
ACC_STATIC | 0x0008 | 内部类是否为protected |
ACC_FINAL | 0x0010 | 内部类是否为protected |
ACC_INTERFACE | 0x0020 | 内部类是否为接口 |
ACC_ABSTRACT | 0x0400 | 内部类是否为abstract |
ACC_SYNTHETIC | 0x1000 | 内部类是否并非由用户代码产生 |
ACC_ANNOTATION | 0x2000 | 内部类是否是一个注解 |
ACC_ENUM | 0x4000 | 内部类是否是一个枚举 |
字段访问标志
标志名称 | 标志值 | 描述 |
---|---|---|
ACC_PUBLIC | 0x0001 | 字段是否为public |
ACC_PRIVATE | 0x0002 | 字段是否为private |
ACC_PROTECTED | 0x0004 | 字段是否为protected |
ACC_STATIC | 0x0008 | 字段是否为static |
ACC_FINAL | 0x0010 | 字段是否为final |
ACC_VOLATILE | 0x0040 | 字段是否为volatile |
ACC_TRANSIENT | 0x0080 | 字段是否为transient |
ACC_SYNTHETIC | 0x1000 | 字段是否由编译器自动产生的 |
ACC_ENUM | 0x4000 | 字段是否为enum |
方法访问标志
标志名称 | 标志值 | 描述 |
---|---|---|
ACC_PUBLIC | 0x0001 | 方法是否为public |
ACC_PRIVATE | 0x0002 | 方法是否为private |
ACC_PROTECTED | 0x0004 | 方法是否为protected |
ACC_STATIC | 0x0008 | 方法是否为static |
ACC_FINAL | 0x0010 | 方法是否为final |
ACC_SYNCHRONIZED | 0x0020 | 方法是否为synchronized |
ACC_BRIDGE | 0x0040 | 方法是否由编译器产生的桥接方法 |
ACC_VARARGS | 0x0080 | 方法是否接受不定参数 |
ACC_NATIVE | 0x0100 | 方法是否为native |
ACC_ABSTRACT | 0x0400 | 方法是否为abstract |
ACC_STRICTFP | 0x0800 | 方法是否为strictfp |
ACC_SYNTHETIC | 0x1000 | 方法是否由编译器自动产生的 |
字段表
用于描述接口和类中声明的变量,包括类级别变量以及实例级别变量
类型 | 名称 | 数量 |
---|---|---|
u2 | access_flags | 1 |
u2 | name_index | 1 |
u2 | descriptor_index | 1 |
u2 | attributes_count | 1 |
u2 | attributes | attributes_count |
其中 access_flags 见上面访问标志表中的字段访问标志
方法表
方法表包含访问标志,名称索引和描述符索引,属性表结合等几项
类型 | 名称 | 数量 |
---|---|---|
u2 | access_flags | 1 |
u2 | name_index | 1 |
u2 | descriptor_index | 1 |
u2 | attributes_count | 1 |
attribute_info | attributes | attributes_count |
其中方法的access_flags见上述的方法访问标志
属性表
属性表用于解释Class文件,字段表,方法表中携带的属性表集合,用于描述某些场景专有的信息。
属性名称 | 使用位置 | 含义 |
---|---|---|
Code | 方法表 | Java代码编译成的字节码指令 |
ConstantValue | 字段表 | final关键字定义的常量值 |
Deprecated | 类,方法表,字段表 | final关键字定义的常量值 |
Exceptions | 方法表 | final方法抛出的异常 |
EnclosingMethod | 类文件 | 仅当一个类为局部类或者匿名类时才能拥有这个属性,这个属性用于标识这个类所在的外围方法 |
InnerClasses | 类文件 | 内部类列表 |
LineNumberTable | Code属性 | Java源码的行号与字节码指令的对应关系 |
LocalVariableTable | Code属性 | 方法的局部变量描述 |
StackMapTable | Code属性 | JDK1.6中新增的属性,供新的类型检查校验器(Type Checker)检查和处理目标方法的局部变量和操作数栈锁需要的类型是否匹配 |
Signature | 类,方法表,字段表 | JDK1.5中新增的属性,这个属性用于支持泛型情况下的方法签名,在java语言中,任何类,接口,初始化方法或成员的泛型签名如果包含了类型变量(Type Variables)或者参数化类型(Parameterized Types),则Signature属性会为它记录泛型签名信息。由于java的泛型采用擦除法实现,在为了类型信息被擦除后导致签名混乱,需要这个属性记录泛型中的相关信息 |
SourceFile | 类文件 | 记录源文件名称 |
SourceDebugExtension | 类文件 | JDK1.6中新增的属性,SourceDebugExtension属性用于存储额外的调试信息。譬如在进行JSP文件调试时,无法通过Java堆栈来定位到JSP文件的行号,JSR-45规范为这些非Java语言编写,却需要编译成字节码并运行在Java虚拟机中的程序提供了一个进行调试的标准机制,使用SourceDebugExtension属性就可以用于存储这个标准所新加入的调试信息 |
Synthetic | 类,方法表,字段表 | 标识方法或者字段是否为编译器自动生成的 |
LocalVariableTypeTable | 类 | JDK1.5中新增的属性,它使用特征签名代替描述符,是为了引入泛型语法之后能描述泛型参数化类型而添加的 |
RuntimevisibleAnnotations | 类,方法表,字段表 | JDK1.5中新增的属性,为动态注解提供支持。RuntimevisibleAnnotations 属性用于指明哪些注解是运行时(实际上运行时就是进行反射调用)可见的 |
RuntimeInvisibleAnnotations | 类,方法表,字段表 | JDK1.5中新增的属性,与 RuntimevisibleAnnotations 属性作用刚好相反, 用于指明哪些注解是运行时不可见的 |
RuntimeVisibleParameterAnnotations | 方法表 | JDK1.5中新增的属性,作用与 RuntimevisibleAnnotations 属性类似,只不过作用对象为方法参数 |
RuntimeInvisibleParameterAnnotations | 方法表 | JDK1.5中新增的属性,作用与 RuntimeInvisibleAnnotations 属性类似,只不过作用对象为方法参数 |
AnnotationDetault | 方法表 | JDK1.5中新增的属性,用于记录注解类元素的默认值 |
BootstrapMethods | 类文件 | JDK1.5中新增的属性,用于保存 invokedynamic 指令引用的引导方法限定符 |
上述的每一个属性,都需要从常量池中引用一个 CONSTANT_Utf8_info类型常量来标示。还包含attribute_length(u4)用于标示属性值所占用的位数,后面再跟着属性内容。
Code属性结构
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | max_stack | 1 |
u2 | max_locals | 1 |
u4 | code_length | 1 |
u1 | code | code_lenght |
u2 | exception_table_lenght | 1 |
exception_info | exception_table | exception_table_length |
u2 | attributes_count | 1 |
attribute_info | attributes | attributes_count |
异常属性结构
类型 | 名称 | 数量 |
---|---|---|
u2 | start_pc | 1 |
u2 | end_pc | 1 |
u2 | handler_pc | 1 |
u2 | catch_type | 1 |
Exceptions属性结构
区别与异常表,该表主要是列举中方法中可能抛出的受检查异常,也就是方法描述时throws关键字列举的异常
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_exceptions | 1 |
u2 | exception_index_table | number_of_exceptions |
LineNumberTable属性结构
用于描述Java源码行号与字节码行号之间的对应关系,默认声称到Class文件中。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | line_number_table_length | 1 |
line_number_info | line_number_table | line_number_table_length |
其中line_number_info包含start_pc和line_number两个u2类型的数据项。
LocalVariableTable属性结构
用于描述栈帧中局部变量表中的变量与Java源码中定义的变量之间的关系,默认生成到Class文件中
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | local_variable_table_lenght | 1 |
local_variable_info | local_variable_table | local_variable_table_lenght |
其中 local_variable_info是代表栈帧与源码中局部变量的关联,见下表
类型 | 名称 | 含义 | 数量 |
---|---|---|---|
u2 | start_pc | 局部变量的生命周期开始的字节码偏移量 | 1 |
u2 | length | 局部变量的生命周期开始的作用范围覆盖长度 | 1 |
u2 | name_index | 指向常量池 CONSTANT_Utf8_info 索引 | 1 |
u2 | descriptor_index | 指向常量池 CONSTANT_Utf8_info 索引 | 1 |
u2 | index | 局部变量在栈帧局部变量表中Slot的位置 | 1 |
SourceFile属性结构
用于记录生成这个Class文件的源码文件名称
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | sourcefile_index | 1 |
其中 sourcefile_index为指向常量池 CONSTANT_Utf8_info 索引
ConstantValue属性结构
用于通知虚拟机自动为静态变量赋值。只有被static关键字修饰的变量才可以使用这项属性。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | constant_index | 1 |
InnerClasses属性结构
用于记录内部类与宿主类之间的关联,如果一个类中定义了内部类,编译器则会为它生成内部类INnerClasses属性
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_classes | 1 |
inner_classes_info | inner_classes | number_of_classes |
每一个inner_classes_info代表一个内部类信息,结构如下
类型 | 名称 | 含义 | 数量 |
---|---|---|---|
u2 | inner_class_info_index | 指向常量池 CONSTANT_Class_info 索引 | 1 |
u2 | outer_class_info_index | 指向常量池 CONSTANT_Class_info 索引 | 1 |
u2 | inner_name_index | 指向常量池 CONSTANT_Utf8_info 索引,代表这个内部类的名称,如果匿名则为0 | 1 |
u2 | inner_class_access_flags | 内部类的访问标志,见上述访问标志篇章 | 1 |
Deprecated/Synthetic属性结构
前者是用于标示某个类,字段或者方法是否不再推荐使用
后者是用于标示字段或者方法不是由Java源码直接产生,所有由非用户代码生成的方法都需要设置Synthetic属性或者ACC_SYNTHETIC标志,但是
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
StackMapTable属性结构
于JDK1.6之后添加在Class规范中,位于Code属性表中,该属性会在虚拟机类加载的字节码校验阶段被新类型检查检验器(Type Checker)使用。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_entries | 1 |
stack_map_frame | stack_map_frame_entries | number_of_entries |
Signature属性结构
于JDK1.5发布之后添加到Class规范中,它是一个可选的定长属性,可以出现在类,属性表,方法表结构的属性表中。该属性会记录泛型签名信息,在Java语言中泛型采用的是擦除法实现的伪泛型,在字节码(Code属性)中,泛型信息编译之后都统统被擦除掉。由于无法像C#等运行时支持获取真泛型类型,添加该属性用于弥补该缺陷,现在Java反射已经能获取到泛型类型。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | signature_index | 1 |
其中 signature_index 值必须是一个对常量池的有效索引且为 CONSTANT_Utf8_info,表示类签名,方法类型签名或字段类型签名。如果当前Signature属性是类文件的属性,则这个结构表示类签名,如果当前Signature属性是方法表的属性,则表示方法类型签名,如果当前Signature属性是字段表的属性,则表示字段类型签名。
BootstrapMethods属性结构
于JDK1.7发布后添加到Class文件规范中,是一个复杂变长的属性,位于类文件的属性表中。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | num_bootstrap_methods | 1 |
bootstrap_method | bootstrap_methods | num_bootstrap_methods |
其中bootstrap_method结构如下
类型 | 名称 | 数量 |
---|---|---|
u2 | bootstrap_method_ref | 1 |
u2 | num_bootstrap_arguments | 1 |
u2 | bootstrap_arguments | num_bootstrap_arguments |
特殊字符串
全限定名,比如 com/yummylau/TestClass 其实就是把类全名的 “.” 换成 “/“,可以使用多个 “;”分割多个全限定名
简单名称,没有类型和参数修饰的方法或者字段的名字,比如方法 inc() 和字段 m 分别标示为 inc 和 m
描述符
标识字符 | 含义 |
---|---|
B | 基本类型 byte |
C | 基本类型 char |
D | 基本类型 double |
F | 基本类型 float |
I | 基本类型 int |
J | 基本类型 long |
S | 基本类型 short |
Z | 基本类型 boolean |
V | 基本类型 void |
L | 对象类型,比如 Ljava/lang/Object |
针对数组,每一个维度使用一个前置的”[“字符来描述,比如定义一个 “java.lang.String[][]”数组,被记录为“[[java.lang.String;”一个整型数组 “int[]” 被记录为[I
针对方法
方法场景 | 描述符 |
---|---|
void inc() | ()V |
java.lang.String toString() | ()Ljava/lang/String; |
int indexOf(char[]source,int sourceOffest,int sourceCount,char[] target,int targetOffset,int targetCOunt,int formIndex) | ([CII[CIII)I |