java中的string

gzcj

浏览: 286230 次
性别:
来自: 北京

最近访客更多访客>>

njdccy

LinApex

tlds119

sunanwenjun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java技术

Java 虚拟机 JVM 数据结构 Eclipse

从javaeye的论坛里看到这篇文章，感觉不错，转过来供自己学习

镜头1】 String对象的创建

   1、关于类对象的创建，很普通的一种方式就是利用构造器，String类也不例外：
           String s=new String("Hello world");
   问题：参数"Hello world"是什么东西，也是字符串对象吗?莫非用字符串对象创建一个字符串对象???

   2、当然，String类对象还有一种大家都很喜欢的创建方式：
           String s="Hello world";
   问题：有点怪呀，怎么与基本数据类型的赋值操作（int i=1）很像呀???

在开始解释这些问题之前，我们先引入一些必要的知识:
(1) Java class文件结构
       我们都知道，Java程序要运行，首先需要编译器将源代码文件编译成字节码文件(也就是.class文件)。然后在由JVM解释执行。
       class文件是8位字节的二进制流。这些二进制流的涵义由一些紧凑的有意义的项组成。比如class字节流中最开始的4个字节组成的项叫做魔数 (magic)，其意义在于分辨class文件(值为0xCAFEBABE)与非class文件。class字节流大致结构如下图左侧。

其中，在class文件中有一个非常重要的项——常量池。这个常量池专门放置源代码中的常量信息(并且不同的常量存放在不同标志的常量表中)。如上图右侧是HelloWorld代码中的常量表（HelloWorld代码如下），其中有四个不同类型的常量表（四个不同的常量池入口）。关于常量池的具体细节，请参照《深入Java虚拟机》第二版第6章。

Java代码

public class HelloWorld{
void hello(){
System.out.println("Hello world");
}
}

public class HelloWorld{
	void hello(){
		System.out.println("Hello world");
	}
}

显然，HelloWorld代码中的"Hello world"被编译之后，可以清楚的看到存放在了class二进制流的常量池项中（上图右侧红框区域）。并且我们还发现常量池中专门有为String类型设置的常量表。也就是说，在编译阶段，就已经将代码中的这种("****")形式作为了字符串常量存放在常量池中了，这一点和下面代码中出现的整形常量(142),浮点型常量(12.1)等的处理是没有区别的。

                   String s="Hello world";
                    int intData=142;
                    double dblData=12.1;

(2) Java虚拟机运行class文件
      当Java虚拟机需要运行一个class文件时，它首先会用类装载器装载进class文件。当然也就需要在内存中存放许多东西。比如class的二进制字节码。还有需要存储class文件中得到的其他信息，比如程序创建的对象，传递给方法的参数，返回值，局部变量等等。怎么多麻烦的数据当然需要管理，JVM会把这些东西都组织到几个“运行时数据区 ”中。这些数据区中就有我们动不动就谈到的"堆"呀，"栈"呀什么的？想要详细了解这部分东西可以看《深入Java虚拟机》第二版第5章。

      在这里我只谈谈“方法区 ”这个运行时数据区。在Java虚拟机中，关于被装载类型的信息会在一个逻辑上被称为"方法区"的内存中，当虚拟机装载某个类型时，它使用类装载器定位相应的class文件，然后读入该文件。紧接着虚拟机提取其中的类型信息，并将这些信息存储到方法区中。

      方法区中的这些类型信息是很有用的，比如：这个类型的全限定名(net.single.HelloWorld)；这个类型的直接超类的全限定名；这个类型是类类型还是接口类型；这个类型的访问修饰符(public,final,static)等。还有两个大家都很熟悉的引用：指向类ClassLoader的引用和指向Class类的引用。这是Java反射机制能够运行的关键所在。这里我们要提到的是一个非常重要的信息——该类型的常量池。

    上面提到的，class文件结构中的常量池二进制流就被JVM存储在方法区中进行管理。当程序运行时需要使用到常量值的时候，直接在方法区常量池所在的内存中寻找就可以了。

(3) 操作码助忆符指令集
将String s=new String("Hello world");编译成class文件后的指令(由eclipse打开class文件查看的):

Class字节码指令集代码

0 new java.lang.String [15]
3 dup
4 ldc <String "Hello word"> [17]
6 invokespecial java.lang.String(java.lang.String) [19]
9 astore_1 [s]
10 retur

0  new java.lang.String [15]  
3  dup
4  ldc <String "Hello word"> [17] 
6  invokespecial java.lang.String(java.lang.String) [19]
9  astore_1 [s]
10  retur

    下面通俗的解释一下这些指令，详细见《深入Java虚拟机》第二版附表：按操作码助忆符排列的指令集。
    ★ new指令: 在内存的堆区域中为新字符串对象分配足够大的空间，并将对象的实例变量设为默认值。
    ★ ldc指令：在内存的方法区常量池中找到String类型字面值常量表的入口，然后定位到的"Hello word"所在内存中的位置。
    ★ invokespecial指令：调用指定的类构造器(这里调用的是String(String)这一个构造器。将ldc指令所找到的"Hello word"的内容传入到new指令所开辟在堆中的字符串对象中。
    ★ astore_1：将new指令所开辟堆的内存位置存入局部变量s中。

将String s="Hello world";编译成class文件后的指令:

Class字节码指令集代码

0 ldc <String "Hello world"> [15]
2 astore_1 [str]
3 return

0  ldc <String "Hello world"> [15]
2  astore_1 [str]
3  return

★ ldc指令：在内存的方法区常量池中找到String类型字面值常量表的入口，然后定位到的"Hello word"所在内存中的位置(如果常量池中没有"Hello word",则会在其中添加一个"Hello word")。
★ astore_1：将ldc指令定位到的常量池中的位置存入局部变量s中。

镜头总结： String类型脱光了其实也很普通。真正让她神秘的原因就在于String类型字面值常量表的存在。

相关问题解决

(问题1) 代码1 代码2

              String sa=new String("Hello world");          String sc="Hello world";
              String sb=new String("Hello world");          String sd="Hello world";
        System.out.println(sa==sb); // false          System.out.println(sc==sd); // true
              变量sa,sb中存储的内容是JVM在堆中开辟的两个String对象的内存地址。==比较就是sa,sb变量存储的内容，也就是两个不同的内存地址，当然是false;
              变量sc,sd中存储的内容也是地址，但却都是方法区常量池中"Hello word"所在的地址，自然一样。

   (问题2) 代码1                                      代码2
              String sa = "ab";                                        String sc="ab"+"cd";
              String sb = "cd";                        String sd="abcd";
        String sab=sa+sb;                                     System.out.println(sc==sd); //true
              String s="abcd";
              System.out.println(sab==s); // false
              代码1中sa+sb被编译以后使用的是StringBuilder.append(String)方法。JVM会在堆中创建一个StringBuilder类，将sa所指向常量池中的内容"ab"传入，然后调用append(sb所指向的常量池内容)完成字符串合并功能，最后将堆中StringBuilder对象的地址赋给变量sab。而s存储的是常量池中"abcd"的地址。sab与s地址当然不一样了。
              代码2中"ab"+"cd"会直接在编译阶段就合并成常量"abcd"，所以相同的字符串在常量池中的地址也相同了。

分享到：

多表连接查询示例 | ORACLE高效sql

2009-11-25 14:45
浏览 1251
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论