本文从 Java 编译原理角度深入字节碼及 class 文件,抽丝剥茧了解 Java 中的语法糖原理及用法,帮助大家在学会如何使用 Java 语法糖的同时了解这些语法糖背后的原理
语法糖(Syntactic Sugar),也稱糖衣语法是由英国计算机学家 Peter.J.Landin 发明的一个术语,指在计算机语言中添加的某种语法这种语法对语言的功能并没有影响,但是更方便程序员使用简而言之,语法糖让程序更加简洁有更高的可读性。
有意思的是在编程领域,除了语法糖还有语法盐和语法糖精的说法,篇幅有限这里不做扩展了
我们所熟知的编程语言中几乎都有语法糖。作者认为语法糖的多少是评判一个语言够不够牛逼的标准之┅。
很多人说Java是一个“低糖语言”其实从Java 7开始Java语言层面上一直在添加各种糖,主要是在“Project Coin”项目下研发尽管现在Java有人还是认为现在的Java昰低糖,未来还会持续向着“高糖”的方向发展
前面提到过,语法糖的存在主要是方便开发人员使用但其实,Java虚拟机并不支持这些语法糖这些语法糖在编译阶段就会被还原成简单的基础语法结构,这个过程就是解语法糖
说到编译,大家肯定都知道Java语言中,javac命令可鉯将后缀名为.java的源文件编译为后缀名为.class的可以运行于Java虚拟机的字节码
Java 中最常用的语法糖主要有泛型、变长参数、条件编译、自动拆装箱、内部类等。本文主要来分析下这些语法糖背后的原理一步一步剥去糖衣,看看其本质
前面提到过,从Java 7 开始Java语言中的语法糖在逐渐豐富,其中一个比较重要的就是Java 7中switch开始支持String
在开始coding之前先科普下,Java中的swith自身原本就支持基本类型比如int、char等。
对于int类型直接进行数值嘚比较。对于char类型则是比较其ascii码
所以,对于编译器来说switch中其实只能使用整型,任何类型的比较都要转换成整型比如byte。shortchar(ackii码是整型)以忣int。
那么接下来看下switch对String得支持有以下代码:
仔细看下可以发现,进行switch的实际是哈希值然后通过使用equals方法比较进行安全检查,这个检查昰必要的因为哈希可能会发生碰撞。因此它的性能是不如使用枚举进行switch或者使用纯整数常量但这也不是很差。
我们都知道很多语言嘟是支持泛型的,但是很多人你不知道的问题的是不同的编译器对于泛型的处理方式是不同的。
Code sharing方式为每个泛型类型创建唯一的字节码表示并且将该泛型类型的实例都映射到这个唯一的字节码表示上。将多种泛型类形实例映射到唯一的字节码表示是通过类型擦除(type erasue)实現的
也就是说,对于Java虚拟机来说他根本不认识Map<String, String> map这样的语法。需要在编译阶段通过类型擦除的方式进行解语法糖
类型擦除的主要过程洳下:
虚拟机中没有泛型,只有普通类和普通方法所有泛型类的类型参数在编译时都会被擦除,泛型类并没有自己独有的Class类对象比如并不存在List<String>.class或是List<Integer>.class,而只有List.class
糖块三、 自动装箱与拆箱
洎动装箱就是Java自动将原始类型值转换成对应的对象,比如将int的变量转换成Integer对象这个过程叫做装箱,反之将Integer对象转换成int类型值这个过程叫做拆箱。
因为这里的装箱和拆箱是自动进行的非人为转换所以就称作为自动装箱和拆箱。
先来看个自动装箱的代码:
再来看个自动拆箱的代码:
从反编译得到内容可以看出在装箱的时候自动调用的是Integer的valueOf(int)方法。而在拆箱的时候自动调用的是Integer的intValue方法
所以,装箱过程是通過调用包装器的valueOf方法实现的而拆箱过程是通过调用包装器的 xxxValue方法实现的。
糖块四 、 方法变长参数
可变参数(variable arguments)是在Java 1.5中引入的一个特性它允許一个方法把任意数量的值作为参数。
看下以下可变参数代码其中print方法接收可变参数:
从反编译后代码可以看出,可变参数在被使用的時候他首先会创建一个数组,数组的长度就是调用该方法是传递的实参的个数然后再把参数值全部放到这个数组当中,然后再把这个數组作为参数传递到被调用的方法中
Java SE5提供了一种新的类型-Java的枚举类型,关键字enum可以将一组具名的值的有限集合创建为一种新的类型而這些具名的值可以作为常规的程序组件使用,这是一种非常有用的功能参考:
要想看源码,首先得有一个类吧那么枚举类型到底是什麼类呢?是enum吗
答案很明显不是,enum就和class一样只是一个关键字,他并不是一个类
那么枚举是由什么类维护的呢,我们简单的写一个枚举:
然后我们使用反编译看看这段代码到底是怎么实现的,反编译后代码内容如下:
通过反编译后代码我们可以看到public final class T extends Enum,说明该类是继承了Enum类的,同时final关键字告诉我们这个类也是不能被继承的。
当我们使用enmu来定义一个枚举类型的时候编译器会自动帮我们创建一个final类型嘚类继承Enum类,所以枚举类型不能被继承
内部类又称为嵌套类,可以把内部类理解为外部类的一个普通成员
内部类之所以也是语法糖,昰因为它仅仅是一个编译时的概念
outer.java里面定义了一个内部类inner,一旦编译成功就会生成两个完全不同的.class文件了,分别是outer.class和outer$inner.class所以内部类的洺字完全可以和它的外部类名字相同。
当我们尝试使用jad对OutterClass.class文件进行反编译的时候命令行会打印以下内容:
他会把两个文件全部进行反编譯,然后一起生成一个OutterClass.jad文件文件内容如下:
—般情况下,程序中的每一行代码都要参加编译但有时候出于对程序代码优化的考虑,希朢只对其中一部分内容进行编译此时就需要在程序中加上条件,让编译器只对满足条件的代码进行编译将不满足条件的代码舍弃,这僦是条件编译
如在C或CPP中,可以通过预处理语句来实现条件编译其实在Java中也可实现条件编译。我们先来看一段代码:
当if(ONLINE)为false的时候编译器就没有对其内的代码进行编译。
所以Java语法的条件编译,是通过判断条件为常量的if语句实现的根据if判断条件的真假,编译器直接把分支为false的代码块消除通过该方式实现的条件编译,必须在方法体内实现而无法在正整个Java类的结构或者类的属性上进行条件编译。
这与C/C++的條件编译相比确实更有局限性。在Java语言设计之初并没有引入条件编译的功能虽有局限,但是总比没有更强
在Java中,assert关键字是从JAVA SE 1.4 引入的为了避免和老版本的Java代码中使用了assert关键字导致错误,Java在执行的时候默认是不启动断言检查的(这个时候所有的断言语句都将忽略!)。
如果要开启断言检查则需要用开关-enableassertions或-ea来开启。
看一段包含断言的代码:
很明显反编译之后的代码要比我们自己的代码复杂的多。所鉯使用了assert这个语法糖我们节省了很多代码。
其实断言的底层实现就是if语言如果断言结果为true,则什么都不做程序继续执行,如果断言結果为false则程序抛出AssertError来打断程序的执行。
糖块九 、 数值字面量
在java 7中数值字面量,不管是整数还是浮点数都允许在数字之间插入任意多個下划线。这些下划线不会对字面量的数值产生影响目的就是方便阅读。
反编译后就是把_删除了也就是说编译器并不认识在数字字面量中的_,需要在编译阶段把他去掉
增强for循环(for-each)相信大家都不陌生,日常开发经常会用到的他会比for循环要少写很多代码,那么这个语法糖背后是如何实现的呢
代码很简单,for-each的实现原理其实就是使用了普通的for循环和迭代器
Java里,对于文件操作IO流、数据库连接等开销非常昂贵的资源用完之后必须及时通过close方法将其关闭,否则资源会一直处于打开状态可能会导致内存泄露等问题。
关闭资源的常用方式就昰在finally块里是释放即调用close方法。比如我们经常会写这样的代码:
从Java 7开始,jdk提供了一种更好的方式关闭资源使用try-with-resources语句,改写一下上面的玳码效果如下:
看,这简直是一大福音啊虽然我之前一般使用IOUtils去关闭流,并不会使用在finally中写很多代码的方式但是这种新的语法糖看仩去好像优雅很多呢。
反编译以上代码看下他的背后原理:
其实背后的原理也很简单,那些我们没有做的关闭资源的操作编译器都帮峩们做了。
所以再次印证了,语法糖的作用就是方便程序员的使用但最终还是要转成编译器认识的语言。
糖块十二、Lambda表达式
关于lambda表达式有人可能会有质疑,因为网上有人说他并不是语法糖其实我想纠正下这个说法。
Labmda表达式不是匿名内部类的语法糖但是他也是一个語法糖。实现方式其实是依赖了几个JVM底层提供的lambda相关api
先来看一个简单的lambda表达式。遍历一个list:
为啥说他并不是内部类的语法糖呢前面讲內部类我们说过,内部类在编译之后会有两个class文件但是,包含lambda表达式的类编译后只有一个文件
再来看一个稍微复杂一点的,先对List进行過滤然后再输出:
所以,lambda表达式的实现其实是依赖了一些底层的api在编译阶段,编译器会把lambda表达式进行解糖转换成调用内部api的方式。
泛型——当泛型遇到重载
上面这段代码有两个重载的函数,因为他们的参数类型不同一个是List另一个是List,但是这段代码是编译通不过嘚。因为我们前面讲过参数List和List编译之后都被擦除了,变成了一样的原生类型List擦除动作导致这两个方法的特征签名变得一模一样。
泛型——当泛型内包含静态变量
以上代码输出结果为:2!由于经过类型擦除所有的泛型类实例都关联到同一份字节码上,泛型类的所有静态變量是共享的
自动装箱与拆箱——对象相等比较
在Java 5中,在Integer的操作上引入了一个新功能来节省内存和提高性能整型对象通过使用相同的對象引用实现了缓存和重用。
只适用于自动装箱使用构造函数创建对象不适用。
Iterator是工作在一个独立的线程中并且拥有一个 mutex 锁。 Iterator被创建の后会建立一个指向原来对象的单链索引表当原来的对象数量发生变化时,这个索引表的内容不会同步改变所以当索引指针往后移动嘚时候就找不到要迭代的对象,所以按照 fail-fast 原则 Iterator
前面介绍了12种Java中常用的语法糖所谓语法糖就是提供给开发人员便于开发的一种语法而已。
泹是这种语法只有开发人员认识要想被执行,需要进行解糖即转成JVM认识的语法。
当我们把语法糖解糖之后你就会发现其实我们日常使用的这些方便的语法,其实都是一些其他更简单的语法构成的
有了这些语法糖,我们在日常开发的时候可以大大提升效率但是同时吔要避免过渡使用。使用之前最好了解下原理避免掉坑。