- 浏览: 405461 次
- 性别:
- 来自: 上海
文章分类
- 全部博客 (255)
- Android (53)
- java (57)
- javascript (7)
- linux (19)
- springside3 (6)
- spring (2)
- struts2 (11)
- hibernate (2)
- jsp&servlet (15)
- jquery (1)
- ExtJs (5)
- freemarker (1)
- apache (5)
- mysql (3)
- tomcat (3)
- eclipse&maven (23)
- 电脑小技巧 (1)
- 配置安装 (3)
- 开源框架 (2)
- 设计模式 (2)
- 架构 (2)
- ajax (1)
- 正则表达式 (7)
- 测试 (2)
- 装修 (1)
- 不错的软件 (4)
- http协议 (2)
- 网络 (2)
- windows (2)
- nodejs (1)
最新评论
-
yhyx:
好
JAVA URI URL区别 -
dingbuoyi:
我文章很早以前写的啊 估计软件版本早更新了 你要自己研究一下
windows下Sublime Text 2开发 Nodejs -
di1984HIT:
写的很好,学习了
【转帖】IP网段的计算和划分 -
农民柏柏:
感谢分享
【转】Android实现人人网点击“+”弹出效果 -
lianwanf:
大神,求源码,很想要那jar包.官方的不懂下载啊.谢谢啊. ...
开源框架ignition[二]
原帖地址:http://blog.csdn.net/BU_BetterYou/archive/2008/06/16/2553108.aspx
写在前面
这一两年,在JVM上使用其他替代语言越来越热门了。现在至少有三门语言有幸在Java Community Process中得到了官方认可:JRuby、Groovy和Bean-Shell。另外,代号为野马(Mustang)的Java 6发布了包含了一个专为封装不同脚本引擎的API层,就像JDBC访问数据库的模式一样。再加上Java版本5也在语言本身上做了很大的调整。总之,就像我之前翻译的一篇BLOG一样,Java平台的编程语言的前景已经发生了巨大的改变。虽然如此,只有一样东西没有变,它是所有这些语言的基础,无论这些语言有多么吸引人的特性和功能,最终都会在JVM的混合语言中运行,即JVM字节码。这又提起了我在JVM/Java字节码方面的兴趣。所以书写本文,在其中将介绍JVM字节码集合,用一些代码来描述它的工作方式,也将介绍一些可以直接操纵字节码的工具。
首先我要说明的是,直接了解JVM字节码感觉是奇怪的事情,因为我们总不可能自己来书写字节码。但是,我们如果知道编译器干了些什么可能会更好一点。比如,你肯定想知道编译后的StringBuffer和String的区别、编译器到底有没有给你加上默认构造函数……当你了解了JVM字节码——这是我看见过的最简单的“可装配语言”——你就能够验证你的这些假设是否正确。
分解Java
考虑到大家对Java都已经比较熟悉了,所以我们这样开始可能比较容易:我们从编译后的Java代码开始,然后对其进行分解。这样可能比一开始就直接讲述Java字节码的规则要好一些。我们先从最简单的Hello World程序开始。
public class HelloWorld
{
public static void main(String[] args)
{
System.out.println("Hello, world!");
}
}
我们通过两种方式来一起研究Java字节码。第一个是太久时间都没有见到过的javap。javap是字节码分解器,意思就是它编译.class文件并将文件结构输出到控制台,其中包括组成方法的字节码。如下例:
$ javap -verbose -c -private HelloWorld
Compiled from "HelloWorld.java"
public class HelloWorld extends java.lang.Object
SourceFile: "HelloWorld.java"
minor version: 0
major version: 50
Constant pool:
const #1 = Method #6.#15; // java/lang/Object."<init>":()V
const #2 = Field #16.#17; // java/lang/System.out:Ljava/io/PrintStream;
const #3 = String #18; // Hello, world!
const #4 = Method #19.#20; // java/io/PrintStream.println:(Ljava/lang/String;)V
const #5 = class #21; // HelloWorld
const #6 = class #22; // java/lang/Object
const #7 = Asciz <init>;
const #8 = Asciz ()V;
const #9 = Asciz Code;
const #10 = Asciz LineNumberTable;
const #11 = Asciz main;
const #12 = Asciz ([Ljava/lang/String;)V;
const #13 = Asciz SourceFile;
const #14 = Asciz HelloWorld.java;
const #15 = NameAndType #7:#8;// "<init>":()V
const #16 = class #23; // java/lang/System
const #17 = NameAndType #24:#25;// out:Ljava/io/PrintStream;
const #18 = Asciz Hello, world!;
const #19 = class #26; // java/io/PrintStream
const #20 = NameAndType #27:#28;// println:(Ljava/lang/String;)V
const #21 = Asciz HelloWorld;
const #22 = Asciz java/lang/Object;
const #23 = Asciz java/lang/System;
const #24 = Asciz out;
const #25 = Asciz Ljava/io/PrintStream;;
const #26 = Asciz java/io/PrintStream;
const #27 = Asciz println;
const #28 = Asciz (Ljava/lang/String;)V;
{
public HelloWorld();
Code:
Stack=1, Locals=1, Args_size=1
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
public static void main(java.lang.String[]);
Code:
Stack=2, Locals=1, Args_size=1
0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3; //String Hello, world!
5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 5: 0
line 6: 8
}
在刚才讲述的.class文件实际并不准确,JVM无所谓输入的二进制流从哪儿来,只不过因为我们的习惯和JDK 1.0的发布所以我们说成是.class文件。所以,所谓的“.class文件”应该被理解为符合JVM标准的二进制格式流。
上面我们使用了javap。其中,-c指示需要显示方法字节码;-private指示无论可访问性显示所有成员;-verbose是需要显示类的常量池。检查HelloWorld分解后的内容,会觉得非常有趣,我们立马就可以验证一些假设。例如,第一,如果类没有显式声明其父类的话,它将继承于java.lang.Object。第二,javap也验证了如果类中没有显式声明构造函数的话,编译器会插入一个缺省无参的构造函数(构造函数在JVM级别是显示成<init>的普通函数)。
加上了-verbose选项的javap输出中一个重要的部分就是常量池。每个类都会有个常量池,所有的常量——比如字符串、类名、方法名、属性名——都是保存在类的中心位置,通过对该池的索引进行参照访问。通常,这些特殊的细节内容都是由工具来处理的,这也是javap通过注释来显示这些常量值的原因。但是这些内容对我们认识常量池非常有用,也能够简化我们对分解代码的理解。例如,第5行代码System.out.println("Hello, world!");它调用了println方法,显示在常量池的编号为4的分片(const #4),它依次由编号为19的分片和编号为20的分片组成(const #4 = Method #19.#20;),这样就最终解决了java.io.PrintStream.println(String[])的问题。你可以参照JVM标准来了解所有不同的常量类型以及他们在.class文件中的格式。
在这里,我们主要来分析自动生成的HelloWorld构造函数:
public HelloWorld();
Code:
Stack=1, Locals=1, Args_size=1
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
在JVM中,所有字节码都是通过一个基本的原则来进行堆栈操作的:每个操作符可能会消费一个或多个操作计数,并可能最后将一个操作计数推送到执行堆栈。需要注意的是,每个分片(slot)都是32位的,这就意味着long或者是double的值会消耗两个分片(slot)(很多人认为这个是JVM实现中的最大缺憾)。另外,每个方法都会有一个本地的结合,本地变量和参数都在此保存。因此,例如“aload_0”指示符将第一个参数带入方法,并将其推送至执行堆栈。“invokespecial”指示符,不言而喻,它将调用实例的方法,但是忽略传统的动态绑定(因为我们显示调用基类版本的覆盖方法,该特殊的操作符用在父“super”调用)。因为Object的构造函数需要一个参数(this指针),所以它将消耗执行堆栈中的一个分片(记住,这是我们刚才推送的参数——this指针,指向我们自己的实例的this指针),而且它不返回任何值(最后有一个V字),当方法返回时它将不往堆栈内推送任何内容。此时,HelloWorld的构造函数已完成任务,所以它通过“return”操作符进行简单返回。
我们接下来在看看写在HelloWorld里面的主方法(main):
public static void main(java.lang.String[]);
Code:
Stack=2, Locals=1, Args_size=1
0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3; //String Hello, world!
5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 5: 0
line 6: 8
因为它是静态方法,所以最显著的区别就是第一个参数并不是this指针,除此之外,它和HelloWorld的构造函数看起来都差不多。第一个操作符“getstatic”将获取一个static区域并将其值推送至堆栈中,在本例中是System.out的引用,由#2常量池分片描述,并在操作符后使用注释显示。接下来,就对字符串“Hello, World!”进行加载,它在#3常量池分片中存储。通过堆栈上的两个引用,我们就可以调用“invokevirtual”PrintStream.println(String[])方法了。因其需要一个参数,再加上调用该方法需要的初始this引用,我们刚才推送至堆栈的这两项就被消费了,println(String[])不返回任何值,所以完成后堆栈上就为空了。一个简单的“return”操作符中止了该方法,任务完成了。
后面的内容会比现在的复杂一些,但总的来说,了解Java字节码的重要部分是需要了解每个操作符是如何操作执行堆栈的。
写在前面
这一两年,在JVM上使用其他替代语言越来越热门了。现在至少有三门语言有幸在Java Community Process中得到了官方认可:JRuby、Groovy和Bean-Shell。另外,代号为野马(Mustang)的Java 6发布了包含了一个专为封装不同脚本引擎的API层,就像JDBC访问数据库的模式一样。再加上Java版本5也在语言本身上做了很大的调整。总之,就像我之前翻译的一篇BLOG一样,Java平台的编程语言的前景已经发生了巨大的改变。虽然如此,只有一样东西没有变,它是所有这些语言的基础,无论这些语言有多么吸引人的特性和功能,最终都会在JVM的混合语言中运行,即JVM字节码。这又提起了我在JVM/Java字节码方面的兴趣。所以书写本文,在其中将介绍JVM字节码集合,用一些代码来描述它的工作方式,也将介绍一些可以直接操纵字节码的工具。
首先我要说明的是,直接了解JVM字节码感觉是奇怪的事情,因为我们总不可能自己来书写字节码。但是,我们如果知道编译器干了些什么可能会更好一点。比如,你肯定想知道编译后的StringBuffer和String的区别、编译器到底有没有给你加上默认构造函数……当你了解了JVM字节码——这是我看见过的最简单的“可装配语言”——你就能够验证你的这些假设是否正确。
分解Java
考虑到大家对Java都已经比较熟悉了,所以我们这样开始可能比较容易:我们从编译后的Java代码开始,然后对其进行分解。这样可能比一开始就直接讲述Java字节码的规则要好一些。我们先从最简单的Hello World程序开始。
public class HelloWorld
{
public static void main(String[] args)
{
System.out.println("Hello, world!");
}
}
我们通过两种方式来一起研究Java字节码。第一个是太久时间都没有见到过的javap。javap是字节码分解器,意思就是它编译.class文件并将文件结构输出到控制台,其中包括组成方法的字节码。如下例:
$ javap -verbose -c -private HelloWorld
Compiled from "HelloWorld.java"
public class HelloWorld extends java.lang.Object
SourceFile: "HelloWorld.java"
minor version: 0
major version: 50
Constant pool:
const #1 = Method #6.#15; // java/lang/Object."<init>":()V
const #2 = Field #16.#17; // java/lang/System.out:Ljava/io/PrintStream;
const #3 = String #18; // Hello, world!
const #4 = Method #19.#20; // java/io/PrintStream.println:(Ljava/lang/String;)V
const #5 = class #21; // HelloWorld
const #6 = class #22; // java/lang/Object
const #7 = Asciz <init>;
const #8 = Asciz ()V;
const #9 = Asciz Code;
const #10 = Asciz LineNumberTable;
const #11 = Asciz main;
const #12 = Asciz ([Ljava/lang/String;)V;
const #13 = Asciz SourceFile;
const #14 = Asciz HelloWorld.java;
const #15 = NameAndType #7:#8;// "<init>":()V
const #16 = class #23; // java/lang/System
const #17 = NameAndType #24:#25;// out:Ljava/io/PrintStream;
const #18 = Asciz Hello, world!;
const #19 = class #26; // java/io/PrintStream
const #20 = NameAndType #27:#28;// println:(Ljava/lang/String;)V
const #21 = Asciz HelloWorld;
const #22 = Asciz java/lang/Object;
const #23 = Asciz java/lang/System;
const #24 = Asciz out;
const #25 = Asciz Ljava/io/PrintStream;;
const #26 = Asciz java/io/PrintStream;
const #27 = Asciz println;
const #28 = Asciz (Ljava/lang/String;)V;
{
public HelloWorld();
Code:
Stack=1, Locals=1, Args_size=1
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
public static void main(java.lang.String[]);
Code:
Stack=2, Locals=1, Args_size=1
0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3; //String Hello, world!
5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 5: 0
line 6: 8
}
在刚才讲述的.class文件实际并不准确,JVM无所谓输入的二进制流从哪儿来,只不过因为我们的习惯和JDK 1.0的发布所以我们说成是.class文件。所以,所谓的“.class文件”应该被理解为符合JVM标准的二进制格式流。
上面我们使用了javap。其中,-c指示需要显示方法字节码;-private指示无论可访问性显示所有成员;-verbose是需要显示类的常量池。检查HelloWorld分解后的内容,会觉得非常有趣,我们立马就可以验证一些假设。例如,第一,如果类没有显式声明其父类的话,它将继承于java.lang.Object。第二,javap也验证了如果类中没有显式声明构造函数的话,编译器会插入一个缺省无参的构造函数(构造函数在JVM级别是显示成<init>的普通函数)。
加上了-verbose选项的javap输出中一个重要的部分就是常量池。每个类都会有个常量池,所有的常量——比如字符串、类名、方法名、属性名——都是保存在类的中心位置,通过对该池的索引进行参照访问。通常,这些特殊的细节内容都是由工具来处理的,这也是javap通过注释来显示这些常量值的原因。但是这些内容对我们认识常量池非常有用,也能够简化我们对分解代码的理解。例如,第5行代码System.out.println("Hello, world!");它调用了println方法,显示在常量池的编号为4的分片(const #4),它依次由编号为19的分片和编号为20的分片组成(const #4 = Method #19.#20;),这样就最终解决了java.io.PrintStream.println(String[])的问题。你可以参照JVM标准来了解所有不同的常量类型以及他们在.class文件中的格式。
在这里,我们主要来分析自动生成的HelloWorld构造函数:
public HelloWorld();
Code:
Stack=1, Locals=1, Args_size=1
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
在JVM中,所有字节码都是通过一个基本的原则来进行堆栈操作的:每个操作符可能会消费一个或多个操作计数,并可能最后将一个操作计数推送到执行堆栈。需要注意的是,每个分片(slot)都是32位的,这就意味着long或者是double的值会消耗两个分片(slot)(很多人认为这个是JVM实现中的最大缺憾)。另外,每个方法都会有一个本地的结合,本地变量和参数都在此保存。因此,例如“aload_0”指示符将第一个参数带入方法,并将其推送至执行堆栈。“invokespecial”指示符,不言而喻,它将调用实例的方法,但是忽略传统的动态绑定(因为我们显示调用基类版本的覆盖方法,该特殊的操作符用在父“super”调用)。因为Object的构造函数需要一个参数(this指针),所以它将消耗执行堆栈中的一个分片(记住,这是我们刚才推送的参数——this指针,指向我们自己的实例的this指针),而且它不返回任何值(最后有一个V字),当方法返回时它将不往堆栈内推送任何内容。此时,HelloWorld的构造函数已完成任务,所以它通过“return”操作符进行简单返回。
我们接下来在看看写在HelloWorld里面的主方法(main):
public static void main(java.lang.String[]);
Code:
Stack=2, Locals=1, Args_size=1
0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3; //String Hello, world!
5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 5: 0
line 6: 8
因为它是静态方法,所以最显著的区别就是第一个参数并不是this指针,除此之外,它和HelloWorld的构造函数看起来都差不多。第一个操作符“getstatic”将获取一个static区域并将其值推送至堆栈中,在本例中是System.out的引用,由#2常量池分片描述,并在操作符后使用注释显示。接下来,就对字符串“Hello, World!”进行加载,它在#3常量池分片中存储。通过堆栈上的两个引用,我们就可以调用“invokevirtual”PrintStream.println(String[])方法了。因其需要一个参数,再加上调用该方法需要的初始this引用,我们刚才推送至堆栈的这两项就被消费了,println(String[])不返回任何值,所以完成后堆栈上就为空了。一个简单的“return”操作符中止了该方法,任务完成了。
后面的内容会比现在的复杂一些,但总的来说,了解Java字节码的重要部分是需要了解每个操作符是如何操作执行堆栈的。
发表评论
-
JAVA中的Observable
2012-06-24 16:51 13871 addObserver deleteObserver都是同 ... -
为什么覆盖了equals方法一定要覆盖hashcode方法?
2012-06-08 11:14 12341 测试代码 public class HashMapTe ... -
java synchronized
2012-03-21 11:30 440我的理解,不一定正确的,如果有错误欢迎留言纠正 1 pub ... -
特殊字符与UNICODE码
2011-08-10 17:27 1688Unicode(统一码、万国码、单一码、标准万国码)是计算机科 ... -
【转】如何用ResourceBundle来读取配置文件 .
2011-08-10 16:47 800引用 对于ja va基础很好的人来说,这个应该是简单的不能再简 ... -
嵌入式JVM
2011-02-22 10:22 1303Robert Lougher发布了嵌入式JVM比较结果。他在嵌 ... -
CLASSPATH PATH 解释
2011-02-11 17:01 724ava执行环境本身就是一个平台,执行于这个平台上的程序是已编译 ... -
【转帖】java verbose命令
2011-02-11 17:01 787java -verbose[:class|gc|jni] ... -
JAVA嵌入式开发
2011-02-11 15:07 1026JVM选用 JAMVM http://jamvm.source ... -
JAVA 编译 解释 运行
2011-02-11 10:19 1303java是混合型语言。 先通过JAVA编译器把.java文件编 ... -
【转帖】类分解器JavaP--分析Java字节码
2011-02-11 09:38 1136原帖地址:http://www.comprg.com.cn/d ... -
【转帖】Java字节码揭秘(四)
2011-02-11 09:36 749原帖地址:http://blog.csdn.net/BU_Be ... -
【转帖】Java字节码揭秘(三)
2011-02-11 09:35 731原帖地址:http://blog.csdn.net/BU_Be ... -
【转帖】Java字节码揭秘(二)
2011-02-11 09:34 754原帖地址:http://blog.csdn.net/BU_Be ... -
JAVA volatile 关键字
2011-01-19 16:30 725每次读这个变量仍然要老老实实从内存读取,每次写这个变量也仍然要 ... -
java 排序
2011-01-11 15:47 9571 对象自然排序 第一种方式 排序对象必须实现Comparab ... -
JAVA 静态变量
2011-01-06 10:52 1199个人的总结 1 静态变量只有一份被类的所有实例共享 2 静态变 ... -
java 正则表达式
2011-01-05 17:18 397http://topic.csdn.net/u/2008082 ... -
java 注解
2011-01-05 10:20 349http://www.iteye.com/topic/4000 ... -
java jce provider
2011-01-04 17:41 7321 http://www.bouncycastle.org/
相关推荐
经典---JAVA设计模式经典---JAVA设计模式
简介:本系列的前一篇文章讨论了智能卡的相关知识,此篇文章则将着重介绍 JAVA 卡的一些基础知识,如 JAVA 卡的概念、结构和生命期,JAVA 卡的 JAVA 语言和编程接口(API),并通过一个简单的Applet示例引入对 JAVA卡...
论坛转帖工具 .......... 纯HTML
这是一个世界编程大赛第一名写的程序,很好玩的,大家试试看。
一键转帖 一键8经验签到. 绿易贴吧工具3.7 11.11版.rar
遍历网页的一段Delphi代码(转帖),给有用的人参考!
编辑人员转帖去水印工具,很好用,直接选中水印区域后运行伪装即可!
都是从零开始学J2ME的,学习J2ME的时候,总是从Java基础开始学习,而且现在讲Java基础的书籍中都是以J2SE来讲基础,这就给学习造成了一些不必要的麻烦,下面将J2ME中用到的和不需要的Java基础知识做一个简单的说明。
转帖性能测试
UBB论坛转帖圣手.exeUBB论坛转帖圣手.exe
转帖:本项目是一个聊天机器人的小例子,使用的图灵(www.tuling123.com)提供的聊天api,javaapk之前也发布过一个聊天机器人http://www.javaapk.com/source/1488.html,现在的问答机器人只能分析关键字做一个简单的...
关于工作与生活的转帖 一篇论述精辟的文章,值得一看。
1.修改自Convert X转帖工具 2.新增批量替换关键词(原来是单个词语替换,可以利用这个...5.新增按颜色屏蔽干扰码 6.新增减少缩进以及优化了首行缩进 7.优化一些小细节 8.重新布局优化显示及方便操作 9.不断更新中...
discuz X2转帖工具、采集工具,discuz论坛批量发帖,批量转帖工具
Html2UBBMaxcj_Softii论坛专用转帖工具
转帖图片提取工具可以对论坛图片附件信息进行清除,只保留图片代码,操作很简单,推荐有需要转帖图片工具的朋友下载 转帖图片提取工具使用方法: 将IP138上处理过的东西复制到上方的编辑框内,点击只要图片,下面...
gl8雨刮维修以及调试转帖.doc
转帖PLCDCSFCS三大控制系统的特点和差异.doc
用PHP批量生成图片缩略图——活跃论坛转帖
OpenStack是一个旨在为公共及私有云的建设与管理提供软件的开源项目。它的社区拥有超过130家企业及1350位开发者,这些机构与个人都将OpenStack作为基础设施即服务(简称IaaS)资源的通用前端。OpenStack项目的首要...