Java的JVM虚拟机对String对象的处置
Java的JVM虚拟机对String对象的处理要理解 java中String的 运作方式,必须明确一点:String是一个非可变类(i
Java的JVM虚拟机对String对象的处理
要理解 java中String的 运作方式,必须明确一点:String是一个非可变类(immutable)。什么是非可变 类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非 可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对 象,甚至可以共享它们的内部信息。(详见 《Effective java》item 13)。String类在java中 被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。
一、创建。
??? 好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:
java 代码
- String?str1?=?new?String("abc");? ??Stirng?str2?=?"abc";??
???? 虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是 不一样的。对于第一种,jvm会马上在heap中创建一个String对象,然后将该对象的 引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对 象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加 至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:
java 代码
- String?str1?=?new?String("abc");?//jvm?在 堆上创建一个String对象 ????
- ?//jvm?在strings?pool 中找不到值为“abc”的字符串,因此 ???//在堆上创建一个String对 象,并将该对象的引用加入至strings?pool中 ??
- ?//此时堆上有两个String对象 ??Stirng?str2?=?"abc"; ??
- ???if(str1?==?str2){ ??
- ?????????System.out.println("str1?==?str2"); ???}else{ ??
- ?????????System.out.println("str1?!=?str2"); ???} ??
- ??//打印结果 是?str1?!=?str2,因为它们是堆上两个不同的对象 ????
- ??String?str3?=?"abc"; ???//此时,jvm发现strings?pool中已有“abc”对 象了,因为“abc”equels?“abc” ??
- ?//因此直接返回str2指向的对象给 str3,也就是说str2和str3是指向同一个对象的引用 ????if(str2?==?str3){ ??
- ?????????System.out.println("str2?==?str3"); ????}else{ ??
- ?????????System.out.println("str2?!=?str3"); ????} ??
- ?//打印结果 为?str2?==?str3??
?? 再看下面的例子:
java 代码
- String?str1?=?new?String("abc");?//jvm?在 堆上创建一个String对象 ????
- str1?=?str1.intern(); ??//程序显式将str1放到strings?pool中,intern运行过程是这样的:首先查 看strings?pool ??
- //有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新 对象的引用加入至 ??//strings?pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会 ??
- //被GC收集。 ????
- //此时,jvm发现strings?pool中已有“abc”对象 了,因为“abc”equels?“abc” ??//因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象, ??
- //此时,堆上的有效对象只有一个。 ??Stirng?str2?=?"abc"; ??
- ???if(str1?==?str2){ ??
- ?????????System.out.println("str1?==?str2"); ???}else{ ??
- ?????????System.out.println("str1?!=?str2"); ???} ??
- ??//打印结果 是?str1?==?str2 ????
?
??? 为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。
二、串接(Concatenation)。
???? java程序员应该都知道滥用String的 串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变 性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但 是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎 么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而 来了。
??? 为了解决这个问题,jdk为String类提供了一个可变的配套 类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上 有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。
三、String的长度
?? 我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳 多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count?的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
??? 不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。 如果超出这个数量,在编译的时候编译器会报错。
- ??/** ?
- ?*? ??*?java?JVM 对String对象的处理 ?
- ?*?test?String.?intern()?方 法? ??*? ?
- ?*/??public?class?TestStringIntern?{ ??
- ????
- ????/** ??????*?@param?args ?
- ?????*/??????public?static?void?main(String[]?args)?{ ??
- ???????? ??????????/* ?
- ?????????*?1.字面上的?"Hi"?字 符串(字符串字面值string?literal)将被自动?intern到虚拟机的字符串池中. ??????????*?2.不是字面上的String对象 通过调用 intern()方法,被intern到虚拟机的字符串池中. ?
- ?????????*? ??????????*?虚拟机的字符串池由 类?String?私有地维护。 ?
- ?????????*/??????????String?a?=?"Hi"; ??
- ????????String?b?=?"Hi"; ??????????String?c?=?new?String("Hi"); ??
- ??????????System.out.println(a?==?b);//?true ??
- ????????System.out.println(a?==?c);//?false ?????????? ??
- ????????c?=?c.intern(); ??????????System.out.println(a?==?c);//?true ??
- ???????? ??????????/* ?
- ?????????*?创建了两个对象? ??????????*?1.字面"AA"?——被 intern到虚拟机字符串池中了。 ?
- ?????????*?2.new?操作符创建 的?对象 ??????????*? ?
- ?????????*?由 AA?!=?AA.intern()可以看出:String?AA?=?new?String("AA");创建了两个对象。 ??????????*/??
- ????????String?AA?=?new?String("AA"); ??????????System.out.println(AA?==?"AA");//?false ??
- ????????System.out.println(AA?==?AA.intern());//?false ??????????System.out.println("AA"?==?AA.intern());//?true ??
- ???????? ?????????? ??
- ????????/* ??????????*?JAVA?规范中的例子: ?
- ?????????*/??????????String?hello?=?"Hello",?lo?=?"lo"; ??
- ????????System.out.print((hello?==?"Hello")?+?"?");??????//true ??????????System.out.print((hello?==?("Hel"+"lo"))?+?"?");?//true ??
- ????????System.out.print((hello?==?("Hel"+lo))?+?"?");???//false--lo为非literal的 ??????????System.out.println(hello?==?("Hel"+lo).intern());//true ??
- ??????} ??
- ??} ??
- ?