分享

Java-String那些事

 黄家v少 2018-04-11


String对于广大程序员来说,并不陌生,是我们在编写程序中经常使用到的对象。但是,你真的对String了解吗,使用的方式对吗?


接下来,笔者就对String来进行全面的解析,让你对String有更深入的了解!

更重要的是,面试的时候,虐虐面试官!


String源码(截取)


通过源码,可以看出String类被final修饰,也就意味着String不能被继承,它其中的方法都默认被final修饰(此特性是final的特点)。也就是说当String对象创建之后,就不能再修改此对象中存储的字符串内容,就是因为如此,才说String类型是不可变的(immutable)


在我们平常创建String对象时,在底层通过char数组来实现。


截取字符串:


拼接两个字符串:


替换字符串中的内容:

截取了String类中的三个常用方法,从这三个方法的返回值中可以看出,无论是substring()、concat()还是replace()方法,他们对字符串的操作都不是在原有字符串上进行的,而是通过一系列操作生成了一个新的字符串对象。


这也符合了我们上面所说的,String类被final修饰不可改变,String对象一单创建就固定不变了,对String对象的任何操作都不会改变原对象,只会新生成一个对象。

image


创建String对象


在Java程序中,创建String对象有两种形式,一种叫做字面量形式,例如:String str = 'jiaboyan';一种叫做构造形式,也就是我们通常的new对象,例如:String str = new String('jiaboyan');


无论是字面量,还是构造形式,在我们编码时都经常使用,尤其是前者。但是,这两种实现方式在性能和内存上却有着不小的差别。


采用字面值的方式赋值:

执行String str1 = 'jiaboyan',程序会去字符串常量池中中查找是否存在'jiaboyan'。如果不存在,则在字符串常量池中创建'jiaboyan',并将“jiaboyan”的引用地址返回给str1,也就是说str1拿到了字符串常量池中“jiaboyan”的引用。如果存在,则不创建任何字符串,直接将池中'jiaboyan'引用地址返回赋给所属变量。当创建字符串对象str2时,字符串池中已经存在'jiaboyan',此时会直接把对象'jiaboyan'的引用地址返回给str2。


采用new关键字新建一个字符串对象:

采用new方式创建对象,执行String str1 = new String('jiaboyan'),程序会在字符串常量池中查找有没有'jiaboyan'这个字符串,如果有,则不在字符串常量池中创建'jiaboyan',直接在堆中创建一个'jiaboyan'字符串对象,然后将堆中的这个'jiaboyan'对象的地址返回给str1;如果没有,则首先在字符串常量池中创建一个'jiaboyan'字符串,然后再在堆中创建一个'jiaboyan'字符串对象,然后将堆中的这个'jiaboyan'对象的地址返回给str2。此时,str1和str2所指向不同的堆内存区域,使用==比较返回为false。


两种创建方式比较:

根据前面的2个例子,可以得出,当我们在创建str1的对象时,实际上程序会去字符串常量池中去创建“jiaboyan”,而当程序执行到str2时,会首先检查字符串常量池中是否存在,若存在则直接在堆内存中创建一个字符串对象;若不存在,则首先在字符串常量池中创建“jiaboyan”,再在堆内存中创建字符串对象。所以,当两者进行比较时,实际上内存地址是不同的。


编译期确定:

str1和str2的原理跟第一个例子相同,不在过多陈述。在str3中,两个字符串拼接起来合成一个字符串,在编译期做了拼接处理,被解析成了一个字符串常量,所以str3在运行期间是以一个整体'jiaboyan'在进行比较,结果为true;


使用javap命令,可以查看到test3()在编译期的处理情况。或者通过查看生成的.class文件。

image


编译期无法确定:

str1和str2的结果,上面的例子已经说明。str1在编译器可以确定,只会在字符串常量池中创建。str2在运行期,会在堆中对象。str3在编译期无法确定内容,所以编译时候无法进行优化拼接,直到运行时才可确定,并生成新的对象在堆中。


编译期无法确定:

String str3 = str1 + str2在编译器无法确定,所以无法做拼接优化。只能等到真正运行时,才能确定。所以当str3 == 'jiaboyan'时,结果为false,因为一个在堆中创建,一个在字符串常量池中。此外,str3虽然无法在堆中做拼接优化,但是str3在编译期还是做了代码优化,使用的是StringBuilder。具体,请看.class文件:

image

两个在编译期无法确认的String,在编译后是通过StringBuilder对象的append()进行处理的,最后在调用toString()将结果返回给str3。所以,在代码中要么就使用全字符串拼接,要不就别拼接。


编译期确定:

回顾下final的含义,当用final修饰一个类时,表明这个类不能被继承。当用final修饰一个变量时,如果是基本数据类型的变量,则其数值一旦在初始化之后便不能更改;如果是引用类型的变量,则在对其初始化之后便不能再让其指向另一个对象。


在编译期间,由于str1和str2使用了final修饰,所以编译器知道该对象不可改变,所以当编译到str3时,会进行代码优化,直接将str1和str2进行字符串拼接,形成一个“jiaboyan”字符串。当执行比较时为true.

image


编译期无法确定:

与上面的例子类似,两个变量str1和str2都用了final修饰。不同的是,str2的值是通过方法来获得。在编译期间,无法确定最终的值,只能在运行时确定,因此str3和“jiaboyan”指向的是不同的内存区域。str3指向了堆中的内存地址,而“jiaboyan”指向的是字符创常量池中。


编译期无法确定:

与前面的例子类似,本例子算是对上面的一个总结。在我们的程序中,是直接拼接字符串,还是字符串和变量共同连接使用。


通过,编译后的class文件来看,str3中使用了StringBuild来处理字符串之间的拼接,最后在通过toString的方式来返回给str3;


在字符串变量中,使用 + 连接符进行连接时,在编译期间,连接操作会将最左侧的字符串拼接,并创建StringBuilder对象,然后依次对右边进行append操作,最后将StringBuilder对象通过toString()方法转换成String对象。当使用 + 进行多个字符串连接时,实际上是产生了一个StringBuilder对象和一个String对象。

image


equals() 和 ==


关于 == 和 equals() 的使用,也是我们面试/日常工作中经常遇到的。对于这两种比较方式,我们需要有一个清晰的理解。


对于 == 来说,如果比较的是基本类型,例如:byte,short,char,int,long,float,double,boolean,那么实际比较的就是该变量真实值是否相同。但,如果比较的是引用类型,例如:new ArrayList(),new Obeject,那么实际比较的该变量实际在内存中的地址。


对于equals()来说,equals()是基类Object中定义的方法,所有对象都默认继承该类,所以也就默认继承了equals()方法。对于默认equals()来说,实际比较的两个对象在内存中的地址是否相同。


值得注意的是,由于equals()方法可以被重写,所以当类中对equals()重写时候,需要单独关注。例如:String类中就对对equals()进行了重写,实际比较的就是两个字符串中内容是否相同,而不是真实的内存地址。


String.intern()


在String类中,有一个intern()方法,该方法的作用是将在堆中的字符串,copy一份存放到字符串常量池中,设计的初衷其实是为了节省内存的使用,提高程序的性能,可以让程序重用String。


代码如下:

测试结果:


使用intern()方法的耗时,要比不使用intern()的耗时更长;


平均来看:1800ms 5500ms


在Java1.6中,String.intern()在调用后,会将在堆中生成的字符串,copy一份到字符串常量池中,进而在常量池中生成了一个新的对象;而在Java1.7中,String.intern()有所改变,不会在常量池中新生成对象,而是将在堆中的引用复制到常量池中。


将一下代码,分别在Java1.6和Java1.7下去执行:

测试结果如下:

image



《可伸缩服务架构:框架与中间件》是《分布式服务架构:原理、设计与实战》的姐妹篇,本书与上册结合后可覆盖保证线上高并发服务的各个主题:一致性、高性 能、高可用、可伸缩、可扩展、敏捷性等。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多