Java戏法

ctbtcol 2014-11-05

展开全文

我们经常遇到这样的情况，有些代码的行为出乎意料。Java语言有很多奇怪的地方，即使有经验的开发者也可能会感到意外。

老实说，经常有资历较浅的同事来问，“执行这段代码有什么样的结果？”，让人措手不及。“我可以告诉你，但是如果你自己找出答案，学到的会更多”，这是很常见的答复。现在可别这么说了，可以先吸引一下他的注意力（哦……我想我看到安吉丽娜·朱莉了，藏在我们的构建服务器后面呢，你可以快去看一下吗？），利用这个时间，快速过一下这篇文章吧。

本文将介绍一些Java的奇怪之处，以帮助开发者做好更充分的准备，使他们再遇到结果令人意外的代码时，能够很好地应对。

率先在国内落地的全球化云服务，深度了解Windows Azure

不可理喻的标识符

我们很熟悉定义合法的Java标识符的规则：

一个标识符是由一个或多个字符（可以是字母、数字、$或下划线）组成的集合。
标识符必须以字母、$或下划线开头。
Java关键字不能用作标识符。
标识符中的字符没有数量限制。
也可以使用从\u00c0到\ud7a3之间的Unicode字符。

规则非常简单，但有些有趣的例子会让人惊讶。比如，开发者可以将类名用作标识符，这是没有限制的：

//类名可以用作标识符
String String = "String"; 
Object Object = null; 
Integer Integer = new Integer(1); 
//让代码难以理解怎么样？ 
Float Double = 1.0f; 
Double Float = 2.0d; 
if (String instanceof String) {
      if (Float instanceof Double) {
          if (Double instanceof Float) {
                System.out.print("Can anyone read this code???");
            }
      }
 }

下面的标识符也都是合法的：

int $ =1;
int € = 2;
int ￡ = 3;
int _ = 4;
long $€￡ = 5;
long €_￡_$ = 6;
long $€￡$€￡$€￡$€￡$€￡$€￡$€_________$€￡$€￡$€￡$€￡$€￡$€￡$€￡$€￡$€￡_____ = 7;

此外，请记住，同样的名字可以同时用于变量和标签。通过分析上下文，编译器知道引用的是哪一个。

int ￡ = 1;
￡: for (int € = 0; € < ￡; €++) {
     if (€ == ￡) {
         break ￡;
     }
}

当然，不要忘了标识符的规则可以应用于变量名、方法名、标签和类名：

class $ {} 
interface _ {} 
class € extends $ implements _ {}

所以我们学到了很厉害的一招，那就是可以编写没有人能理解的代码，包括我们自己！

NullPointerException从何而来？

自动装箱是在Java 5中引入的，给我们带来了很多方便，我们不用在基本类型和其包装器类型之间跳来跳去了：

int primitiveA = 1;
Integer wrapperA = primitiveA;
wrapperA++;
primitiveA = wrapperA;

运行时并没有为了支持这种变化而做修改，大部分工作都是编译时完成的。对于前面这段代码，编译器会生成类似下面这样的代码：

int primitiveA = 1;
Integer wrapperA = new Integer(primitiveA);
int tmpPrimitiveA = wrapperA.intValue();
tmpPrimitiveA++;
wrapperA = new Integer(tmpPrimitiveA);
primitiveA = wrapperA.intValue();

前面的自动装箱也可以应用于方法调用：

public static int calculate(int a) {
     int result = a + 3;
     return result;
}
public static void main(String args[]) {
     int i1 = 1;
     Integer i2 = new Integer(1);
     System.out.println(calculate(i1));
     System.out.println(calculate(i2));
}

真棒，对于以基本类型为参数的方法，我们可以向其传递相应的包装器类型，让编译器来执行变换：

public static void main(String args[]) {
     int i1 = 1;
     Integer i2 = new Integer(1);
     System.out.println(calculate(i1));
     int i2Tmp = i2.intValue();
     System.out.println(calculate(i2Tmp));
}

稍作修改，再来试试：

public static void main(String args[]) {
     int i1 = 1;
     Integer i2 = new Integer(1);
     Integer i3 = null;
     System.out.println(calculate(i1));
     System.out.println(calculate(i2));
     System.out.println(calculate(i3));
}

和前面一样，这段代码会被翻译成：

public static void main(String args[]) {
     int i1 = 1;
     Integer i2 = new Integer(1);
Integer i3 = null;
     System.out.println(calculate(i1));
     int i2Tmp = i2.intValue();
     System.out.println(calculate(i2Tmp));
     int i3Tmp = i3.intValue();
     System.out.println(calculate(i3Tmp));
}

当然，这段代码会让我们看到老朋友NullPointerException。像下面这种更简单的情况，同样如此：

public static void main(String args[]) {
     Integer iW = null;
     int iP = iW;
}

所以在使用自动拆箱时一定要非常小心，它可能导致NullPointerException；而在该特性引入之前，是不可能遇到此类异常的。更糟糕的是，识别这些代码模式有时并不容易。如果必须将一个包装器类型的变量转换成基本类型变量，而且不确定其是否可能为null，那就要为代码做好保护措施。

包装器类型遭遇同一性危机

继续自动装箱这个话题，看一下下面的代码：

Short s1 = 1;
Short s2 = s1;
System.out.println(s1 == s2);

当然打印true了。现在来点有趣的：

Short s1 = 1;
Short s2 = s1;
s1++;
System.out.println(s1 == s2);

输出成了false。等等，什么情况？难道s1和s2引用的不是同一个对象吗？JVM真是疯了！还是用前面提到的代码翻译机制来看看吧：

Short s1 = new Short((short)1);
Short s2 = s1;
short tempS1 = s1.shortValue();
tempS1++;
s1 = new Short(tempS1);
System.out.println(s1 == s2);

哦……这么看是更合理了，不是吗？使用自动装箱的时候总得小心！

妈妈快看，没有异常！

下面这个非常简单，但是很多有经验的Java开发者都会中招。闲话少说，看代码：

NullTest myNullTest = null;
System.out.println(myNullTest.getInt());

当看到这段代码时，很多人会以为会出现NullPointerException。果真如此吗？看看其余代码再说：

class NullTest {
     public static int getInt() {
         return 1;
     }
}

永远记住，类变量和类方法的使用，仅仅依赖引用的类型。即使引用为null，仍然可以调用。从良好实践的角度来看，明智的做法是使用NullTest.getInt()来代替myNullTest.getInt()，但鬼知道什么时候会碰上这样的代码。

变长参数和数组，必要的变通

变长参数特性带来了一个强大的概念，可以帮助开发者简化代码。不过变长参数的背后是什么呢？不多不少，就是一个数组。

public void calc(int... myInts) {} 
calc(1, 2, 3);

编译器会将前面的代码翻译成类似这样：

int[] ints = {1, 2, 3};
calc(ints);

当心空调用语句，这相当于传递了一个null作为参数。

calc();
等价于
int[] ints = null;
calc(ints);

当然，下面的代码会导致编译错误，因为两条语句是等价的：

public void m1(int[] myInts) { ...    } 
public void m1(int... myInts) { ...    }

可变的常量

大部分开发者认为，当变量定义中出现final关键字时，指示的就是一个常量，也就是说，这个变量的值不可改变。这并不完全正确，当final关键字应用于变量时，只是说明该变量只能赋值一次。

class MyClass {
     private final int myVar;
     private int myOtherVar = getMyVar();
     public MyClass() {
         myVar = 10;
     }
     public int getMyVar() {
         return myVar;
     }
     public int getMyOtherVar() {
         return myOtherVar;
     }
     public static void main(String args[]) {
         MyClass mc = new MyClass();
         System.out.println(mc.getMyVar());
         System.out.println(mc.getMyOtherVar());
     }
}

前面的代码将打印10 0。因此，在处理final变量时，必须区分两种情况：一种是在编译时就赋了默认值的，这种就是常量；另一种是在运行时初始化的。

覆盖的特色

请记住，从Java 5开始，覆盖方法的返回类型可以与被覆盖方法不同。唯一的规则是，覆盖方法的返回类型是被覆盖方法的返回类型的子类型。所以在Java 5中下面的代码成了合法的：

class A {
     public A m() {
         return new A();     
}
} 

class B extends A {
     public B m() {
         return new B();
     }
}

重载操作符

就操作符重载而言，Java不是特别强，但它确实支持+操作符的重载。该操作符可以用于算术加法和字符串连接，具体取决于上下文。

int val = 1 + 2;
String txt = "1" + "2";

当字符串中混入了数值类型，事情就复杂了。但是规则很简单，在遇到字符串操作数之前，会一直执行算术加法。一出现字符串，两个操作数都会被转为字符串（如果需要的话），并执行一次字符串连接。下面例子说明了不同的组合：

System.out.println(1 + 2); //执行加法，打印3 

System.out.println("1" + "2"); //执行字符串连接，打印12
System.out.println(1 + 2 + 3 + "4" + 5); //执行加法，直到发现"4"，然后执行字符串连接，打印645

System.out.println("1" + "2" + "3" + 4 + 5); //执行字符串连接，打印12345

奇怪的日期格式

这个花招与DateFormat的实现有关，其使用方式有一定的误导性，而且有的时候，代码到了产品中，问题才会暴露出来。

DateFormat 的parse方法会解析一个字符串，并生成一个日期。解析过程是根据定义的日期格式掩码来工作的。根据Java Doc，如果指定的字符串的开头部分无法解析，会抛出一个ParseException。这个定义很模糊，可以有不同的解释。大部分开发者认为，如果字符串参数与定义的格式不匹配，会抛出ParseException。但情况并非总是如此。

对于SimpleDateFormat，大家应该非常小心。当面对下面的代码时，大部分开发者认为会抛出ParseException。

String date = "16-07-2009";

SimpleDateFormat sdf = new SimpleDateFormat("ddmmyyyy");
try {     
Date d = sdf.parse(date);
     System.out.println(DateFormat.getDateInstance(DateFormat.MEDIUM,
                     new Locale("US")).format(d));
} catch (ParseException pe) {
     System.out.println("Exception: " + pe.getMessage());
}

运行这段代码，会产生下列输出：Jan 16, 0007。真是奇怪，编译器竟然没有指出字符串与预期的格式不匹配，而是继续处理，而且尽其最大努力来解析文本。请注意，这里有两个隐藏的花招。其一，月份的掩码是MM，而mm用于分钟，这就解释了为什么月份被设置成了一月。其二，DecimalFormat类的parse方法将一直解析文本，直到遇到无法解析的字符，返回的是到目前这个位置已经处理过的数字。所以“7-20”将翻译成7年。这种差异很容易看出来，但如果使用的是“yyyymmdd”，情况就更复杂了，输出将是“Jan 7, 0016”。解析“16-0”，直到遇到第一个不可解析的字符，所以16会被当成年份。“-0”不会影响结果，它会被理解为0分钟。之后“7-”就被映射到天数了。

译者注：文中关于自动装箱的说明不够准确，像“Integer wrapperA = primitiveA;”这条语句，编译器的处理策略是将其映射为“Integer wrapperA = Integer.valueOf(primitive);”,Short的处理类似。有兴趣的读者可以自行测试。

另外，对Java谜题感兴趣的读者可以阅读Joshua Bloch的《Java解惑》一书，其中列出了很多容易出错的地方。