Java字节码分类
JVM字节码集合基本上是分为几个不同的大类的。我们不会逐一介绍字节码的操作符,我们讨论类别,然后着重拿出一些常用的操作符,其余的均可通过JVM规范来获取详情。
堆栈操作。
- pop、pop2:将堆栈的值弹出。pop2用来弹出64位的值,pop用来弹出32位的。
- dup、dup2:复制堆栈顶端的值。用来形成高效的pop/push/push组合。dup2也是用在64位上的。
- const_null将null的引用推送至堆栈。
- bipush将单字节的常量值(-127~128)推送至堆栈。
- sipush将一个短整型类型的常量值(-32K~32K)推送至堆栈。
- ldc将常量值从常量池中推送至堆栈。
- Xload,X可为a、d、f、l或者i,是将一个本地(参数或变量)的指定类型推送至堆栈。a指引用、b指布尔类型、c指字符、d指双精度类型、f指浮点类型、i指整型、l指长整型、s指短整型。该编码模式会在操作符的名字中重复出现。
- Xstore,X可为a、d、f、l或者i,将堆栈顶端的值弹出并放入本地分片中。
- Xconst_Y是操作符集合中一系列的优化操作,设计用来将X类型的常量Y值推送至堆栈。例如,iconst_0就是将整数常量0推送至堆栈中,是bipush的高效硬编码变种。
分支与控制流。
- nop,啥也不做。
- if(条件),条件可以是null、notnull、eq、ne、gt、lt、_icmpeq、_icmpne……。
- goto。Java代码虽然不支持goto,但JVM是支持的。
- return和Xreturn。X可以为a、d、f、l或者i,从当前调用方返回,将堆栈顶端作为X类型返回。
- lookupswitch提供了对switch/case表的实现。
算法指令。JVM操作符合其他CPU指令集一样有一些基本的算术运算符,例如加减乘除等,也包含一些基本的转换操作符进行放大与缩小的转换:
- 数据转换操作符采用XtoY的形式,X和Y可以是a、d、f、l或者i,堆栈的顶端取符合X格式的数,并将转换成Y格式后推送回堆栈。
- 算术运算符采用XOP的格式,X可为d、f、i或者l,OP可为加减乘除和取余。
- 字节操作符采用iOP的格式,OP可为与、或、异或、左移位(shift left)、右移位(shift right)。
- 比较操作符采用XcmpY的格式,X可以是d,即基于双精度的比较;f,即基于浮点的比较;或l,即基于长整型的比较。Y可以是g或者l。两个数比较,第一个>第二个,则将1推送至堆栈;如果=,则推送0;如果<,则推送-1。
对象模型指令。JVM内置的专门为对象工作的操作符:创建对象、调用方法、访问属性等:
- new、newarray、anewarray:创建一个新对象、创建一个数组和创建一个对象应用的数组。对象或数组被推送至堆栈的顶端。在new操作符时,并未调用构造函数,调用构造函数是后续代码的工作。
- getfield、setfield、getstatic、setstatic。在设置值时,值在堆栈的顶端,而对象引用就正好在下方跟着。如果是静态属性的话,显然不需要任何对象引用。
- invokevirtual、invokestatic、invokespecial、invokeinterface。它们都是调用方法的操作符,方法则由操作计数指定的常量池入口描述。使用推送至堆栈的值作为由左至右的调用参数,即调用的第一个参数位于堆栈的最下部;this引用位于第一个,也就是在堆栈的最下部引用。Invokevirtual操作符表示调用是对对象方法的普通调用,invokeinterface就是当通过接口的引用调用方法时,invokestatic表示调用静态方法,invokespecial表明无需考虑动态绑定的方法调用——为了调用特定版本的类的方法,而不管衍生覆盖类型。
- castclass、instanceof。这两个操作符处理堆栈顶部的引用转换为操作计数隐含的类型。如果成功,新引用或true将被推送至堆栈顶端,如果失败,则CastClassException异常或false被推送。
块同步(同步块或方法)。块同步由两个操作符处理,monitorenter与monitorexit。当调用对象试图获取监控器的代码时,它们都在堆栈上分别持有该对象的引用。事实上是编译器负责保证均衡的出入口调用,所以同步方法或同步块通常需要在try/finally块中来保证monitorexit操作符一定会被调用。如果不这样做的话,就会让监控器一直被线程占有,最终导致死锁。
异常处理。异常处理并非通过特殊的操作符集合来处理,而是通过创建一个表格,里面标记了块指令——监视并创建一系列的包括需要做什么的入口,也即当特定类型的异常抛出后的操作符偏移量。
|