类加载是java语言提供的最强大的机制之一。尽管类加载并不是讨论的热点话题,但所有的编程人员都应该了解其工作机制,明白如何
做才能让其满足我们的需要。这能有效节省我们的编码时间,从不断调试ClassNotFoundException,
ClassCastException的工作中解脱出来。 在JAVA中,一个类用其完全匹配类名(fully qualified class name)作为标识,这里指的完全匹配类名包括包名和类名。但在JVM中一个类用其全名和一个加载类ClassLoader的实例作为唯一标识。因此,如 果一个名为Pg的包中,有一个名为Cl的类,被类加载器KlassLoader的一个实例kl1加载,Cl的实例,即C1.class在JVM中表示为 (Cl, Pg, kl1)。这意味着两个类加载器的实例(Cl, Pg, kl1) 和 (Cl, Pg, kl2)是不同的,被它们所加载的类也因此完全不同,互不兼容的。那么在JVM中到底有多少种类加载器的实例?下一节我们揭示答案。 类加载器 在JVM中,每一个类都被java.lang.ClassLoader的一些实例来加载.类ClassLoader是在包中java.lang里,开发者可以自由地继承它并添加自己的功能来加载类。 无论何时我们键入java MyMainClass来开始运行一个新的JVM,“引导类加载器(bootstrap class loader)”负责将一些关键的Java类,如java.lang.Object和其他一些运行时代码先加载进内存中。运行时的类在JRE\lib \rt.jar包文件中。因为这属于系统底层执行动作,我们无法在JAVA文档中找到引导类加载器的工作细节。基于同样的原因,引导类加载器的行为在各 JVM之间也是大相径庭。 同理,如果我们按照如下方式: log(java.lang.String.class.getClassLoader()); 来获取java的核心运行时类的加载器,就会得到null。 接下来介绍java的扩展类加载器。扩展库提供比java运行代码更多的特性,我们可以把扩展库保存在由java.ext.dirs属性提供的路径中。 (编辑注:java.ext.dirs属性指的是系统属性下的一个key,所有的系统属性可以通过System.getProperties()方法获 得。在编者的系统中,java.ext.dirs的value是” C:\Program Files\Java\jdk1.5.0_04\jre\lib\ext”。下面将要谈到的如java.class.path也同属系统属性的一个 key。) 类ExtClassLoader专门用来加载所有java.ext.dirs下的.jar文件。开发者可以通过把自己的.jar文件或库文件加入到扩展目录的classpath,使其可以被扩展类加载器读取。 从开发者的角度,第三种同样也是最重要的一种类加载器是AppClassLoader。这种类加载器用来读取所有的对应在java.class.path系统属性的路径下的类。 Sun的java指南中,文章“理解扩展类加载”(Understanding Extension Class Loading)对以上三个类加载器路径有更详尽的解释,这是其他几个JDK中的类加载器 ●java.net.URLClassLoader ●java.security.SecureClassLoader ●java.rmi.server.RMIClassLoader ●sun.applet.AppletClassLoader java.lang.Thread,包含了public ClassLoader getContextClassLoader()方法,这一方法返回针对一具体线程的上下文环境类加载器。此类加载器由线程的创建者提供,以供此线程中运 行的代码在需要加载类或资源时使用。如果此加载器未被建立,缺省是其父线程的上下文类加载器。原始的类加载器一般由读取应用程序的类加载器建立。 类加载器如何工作? 除了引导类加载器,所有的类加载器都有一个父类加载器,不仅如此,所有的类加载器也都是java.lang.ClassLoader类型。以上两种类加载 器是不同的,而且对于开发者自订制的类加载器的正常运行也至关重要。最重要的方面是正确设置父类加载器。任何类加载器,其父类加载器是加载该类加载器的类 加载器实例。(记住,类加载器本身也是一个类!) 使用loadClass()方法可以从类加载器中获得该类。我们可以通过java.lang.ClassLoader的源代码来了解该方法工作的细节,如下: protected synchronized Class<?> loadClass (String name, boolean resolve) throws ClassNotFoundException{ // First check if the class is already loaded Class c = findLoadedClass(name); if (c == null) { try { if (parent != null) { c = parent.loadClass(name, false); } else { c = findBootstrapClass0(name); } } catch (ClassNotFoundException e) { // If still not found, then invoke // findClass to find the class. c = findClass(name); } } if (resolve) { resolveClass(c); } return c; } 我们可以使用ClassLoader的两种构造方法来设置父类加载器: public class MyClassLoader extends ClassLoader{ public MyClassLoader(){ super(MyClassLoader.class.getClassLoader()); } } 或 public class MyClassLoader extends ClassLoader{ public MyClassLoader(){ super(getClass().getClassLoader()); } } 第一种方式较为常用,因为通常不建议在构造方法里调用getClass()方法,因为对象的初始化只是在构造方法的出口处才完全完成。因此,如果父类加载 器被正确建立,当要示从一个类加载器的实例获得一个类时,如果它不能找到这个类,它应该首先去访问其父类。如果父类不能找到它(即其父类也不能找不这个 类,等等),而且如果findBootstrapClass0()方法也失败了,则调用findClass()方法。findClass()方法的缺省实 现会抛出ClassNotFoundException,当它们继承java.lang.ClassLoader来订制类加载器时开发者需要实现这个方 法。findClass()的缺省实现方式如下: protected Class<?> findClass(String name) throws ClassNotFoundException { throw new ClassNotFoundException(name); } 在findClass()方法内部,类加载器需要获取任意来源的字节码。来源可以是文件系统,URL,数据库,可以产生字节码的另一个应用程序,及其他类 似的可以产生java规范的字节码的来源。你甚至可以使用BCEL (Byte Code Engineering Library:字节码工程库),它提供了运行时创建类的捷径。BCEL已经被成功地使用在以下方面:编译器,优化器,混淆器,代码产生器及其他分析工 具。一旦字节码被检索,此方法就会调用defineClass()方法,此行为对不同的类加载实例是有差异的。因此,如果两个类加载实例从同一个来源定义 一个类,所定义的结果是不同的。 JAVA语言规范(Java language specification)详细解释了JAVA执行引擎中的类或接口的加载(loading),链接(linking)或初始化(initialization)过程。 图一显示了一个主类称为MyMainClass的应用程序。依照之前的阐述,MyMainClass.class会被AppClassLoader加载。 MyMainClass创建了两个类加载器的实例:CustomClassLoader1 和 CustomClassLoader2,他们可以从某数据源(比如网络)获取名为Target的字节码。这表示类Target的类定义不在应用程序类路径 或扩展类路径。在这种情况下,如果MyMainClass想要用自定义的类加载器加载Target类,CustomClassLoader1和 CustomClassLoader2会分别独立地加载并定义Target.class类。这在java中有重要的意义。如果Target类有一些静态的 初始化代码,并且假设我们只希望这些代码在JVM中只执行一次,而这些代码在我们目前的步骤中会执行两次——分别被不同的 CustomClassLoaders加载并执行。如果类Target被两个CustomClassLoaders加载并创建两个实例Target1和 Target2,如图一显示,它们不是类型兼容的。换句话说,在JVM中无法执行以下代码: Target target3 = (Target) target2; 以上代码会抛出一个ClassCastException。这是因为JVM把他们视为分别不同的类,因为他们被不同的类加载器所定义。这种情况当我们不是 使用两个不同的类加载器CustomClassLoader1 和 CustomClassLoader2,而是使用同一个类加载器CustomClassLoader的不同实例时,也会出现同样的错误。这些会在本文后边 用具体代码说明。 ![]() 图1. 在同一个JVM中多个类加载器加载同一个目标类 关于类加载、定义和链接的更多解释,请参考Andreas Schaefer的"Inside Class Loaders." 为什么我们需要我们自己的类加载器 原因之一为开发者写自己的类加载器来控制JVM中的类加载行为,java中的类靠其包名和类名来标识,对于实现了 java.io.Serializable接口的类,serialVersionUID扮演了一个标识类版本的重要角色。这个唯一标识是一个类名、接口 名、成员方法及属性等组成的一个64位的哈希字段,而且也没有其他快捷的方式来标识一个类的版本。严格说来,如果以上的都匹配,那么则属于同一个类。 但是让我们思考如下情况:我们需要开发一个通用的执行引擎。可以执行实现某一特定接口的任何任务。当任务被提交到这个引擎,首先需要加载这个任务的代码。 假设不同的客户对此引擎提交了不同的任务,凑巧,这些所有的任务都有一个相同的类名和包名。现在面临的问题就是这个引擎是否可以针对不同的用户所提交的信 息而做出不同的反应。这一情况在下文的参考一节有可供下载的代码样例,samepath 和 differentversions,这两个目录分别演示了这一概念。 图2 显示了文件目录结构,有三个子目录samepath, differentversions, 和 differentversionspush,里边是例子: ![]() 图2. 文件夹结构组织示例 在samepath 中,类version.Version保存在v1和v2两个子目录里,两个类具有同样的类名和包名,唯一不同的是下边这行: public void fx(){ log("this = " + this + "; Version.fx(1)."); } V1中,日志记录中有Version.fx(1),而在v2中则是Version.fx(2)。把这个两个存在细微不同的类放在一个classpath下,然后运行Test类: set CLASSPATH=.;%CURRENT_ROOT%\v1;%CURRENT_ROOT%\v2 %JAVA_HOME%\bin\java Test 图3显示了控制台输出。我们可以看到对应着Version.fx(1)的代码被执行了,因为类加载器在classpath首先看到此版本的代码。 ![]() 图3. 在类路径中samepath测试排在最前面的version 1 再次运行,类路径做如下微小改动。 set CLASSPATH=.;%CURRENT_ROOT%\v2;%CURRENT_ROOT%\v1 %JAVA_HOME%\bin\java Test 控制台的输出变为图4。对应着Version.fx(2)的代码被加载,因为类加载器在classpath中首先找到它的路径。 ![]() 图4. 在类路径中samepath测试排在最前面的version 2 根据以上例子可以很明显地看出,类加载器加载在类路径中被首先找到的元素。如果我们在v1和v2中删除了version.Version,做一个非 version.Version形式的.jar文件,如myextension.jar,把它放到对应java.ext.dirs的路径下,再次执行后看 到version.Version不再被AppClassLoader加载,而是被扩展类加载器加载。如图5所示。 ![]() 图5. AppClassLoader及ExtClassLoader 继续这个例子,文件夹differentversions包含了一个RMI执行引擎,客户端可以提供给执行引擎任何实现了common.TaskIntf 接口的任务。子文件夹client1 和 client2包含了类client.TaskImpl有个细微不同的两个版本。两个类的区别在以下几行: static{ log("client.TaskImpl.class.getClassLoader (v1) : " + TaskImpl.class.getClassLoader()); } public void execute(){ log("this = " + this + "; execute(1)"); } 在client1和client2里分别有getClassLoader(v1) 与 execute(1)和getClassLoader(v2) 与 execute(2)的的log语句。并且,在开始执行引擎RMI服务器的代码中,我们随意地将client2的任务实现放在类路径的前面。 CLASSPATH=%CURRENT_ROOT%\common;%CURRENT_ROOT%\server; %CURRENT_ROOT%\client2;%CURRENT_ROOT%\client1 %JAVA_HOME%\bin\java server.Server 如图6,7,8的屏幕截图,在客户端VM,各自的client.TaskImpl类被加载、实例化,并发送到服务端的VM来执行。从服务端的控制台,可以 明显看到client.TaskImpl代码只被服务端的VM执行一次,这个单一的代码版本在服务端多次生成了许多实例,并执行任务。 ![]() 图6. 执行引擎服务器控制台 图6显示了服务端的控制台,加载并执行两个不同的客户端的请求,如图7,8所示。需要注意的是,代码只被加载了一次(从静态初始化块的日志中也可以明显看出),但对于客户端的调用这个方法被执行了两次。 ![]() 图7. 执行引擎客户端 1控制台 图7中,客户端VM加载了含有client.TaskImpl.class.getClassLoader(v1)的日志内容的类TaskImpl的代码,并提供给服务端的执行引擎。图8的客户端VM加载了另一个TaskImpl的代码,并发送给服务端。 ![]() 图8. 执行引擎客户端 2控制台 在客户端的VM中,类client.TaskImpl被分别加载,初始化,并发送到服务端执行。图6还揭示了client.TaskImpl的代码只在服 务端的VM中加载了一次,但这“唯一的一次”却在服务端创造了许多实例并执行。或许客户端1该不高兴了因为并不是它的 client.TaskImpl(v1)的方法调用被服务端执行了,而是其他的一些代码。如何解决这一问题?答案就是实现定制的类加载器。 定制类加载器 要较好地控制类的加载,就要实现定制的类加载器。所有自定义的类加载器都应继承自java.lang.ClassLoader。而且在构造方法中,我们也 应该设置父类加载器。然后重写findClass()方法。differentversionspush文件夹包含了一个叫做 FileSystemClassLoader的自订制的类加载器。其结构如图9所示。 ![]() 图9. 定制类加载器关系 以下是在common.FileSystemClassLoader实现的主方法: public byte[] findClassBytes(String className){ try{ String pathName = currentRoot + File.separatorChar + className. replace('.', File.separatorChar) + ".class"; FileInputStream inFile = new FileInputStream(pathName); byte[] classBytes = new byte[inFile.available()]; inFile.read(classBytes); return classBytes; } catch (java.io.IOException ioEx){ return null; } } public Class findClass(String name)throws ClassNotFoundException{ byte[] classBytes = findClassBytes(name); if (classBytes==null){ throw new ClassNotFoundException(); } else{ return defineClass(name, classBytes, 0, classBytes.length); } } public Class findClass(String name, byte[] classBytes)throws ClassNotFoundException{ if (classBytes==null){ throw new ClassNotFoundException( "(classBytes==null)"); } else{ return defineClass(name, classBytes, 0, classBytes.length); } } public void execute(String codeName, byte[] code){ Class klass = null; try{ klass = findClass(codeName, code); TaskIntf task = (TaskIntf) klass.newInstance(); task.execute(); } catch(Exception exception){ exception.printStackTrace(); } } 这个类供客户端把client.TaskImpl(v1)转换成字节数组,之后此字节数组被发送到RMI服务端。在服务端,一个同样的类用来把字节数组的内容转换回代码。客户端代码如下: public class Client{ public static void main (String[] args){ try{ byte[] code = getClassDefinition ("client.TaskImpl"); serverIntf.execute("client.TaskImpl", code); } catch(RemoteException remoteException){ remoteException.printStackTrace(); } } private static byte[] getClassDefinition (String codeName){ String userDir = System.getProperties(). getProperty("BytePath"); FileSystemClassLoader fscl1 = null; try{ fscl1 = new FileSystemClassLoader (userDir); } catch(FileNotFoundException fileNotFoundException){ fileNotFoundException.printStackTrace(); } return fscl1.findClassBytes(codeName); } } 在执行引擎中,从客户端收到的代码被送到定制的类加载器中。定制的类加载器把其从字节数组定义成类,实例化并执行。需要指出的是,对每一个客户请求,我们 用类FileSystemClassLoader的不同实例来定义客户端提交的client.TaskImpl。而且,client.TaskImpl并 不在服务端的类路径中。这也就意味着当我们在FileSystemClassLoader调用findClass()方法时,findClass()调用 内在的defineClass()方法。类client.TaskImpl被特定的类加载器实例所定义。因此,当 FileSystemClassLoader的一个新的实例被使用,类又被重新定义为字节数组。因此,对每个客户端请求类client.TaskImpl 被多次定义,我们就可以在相同执行引擎JVM中执行不同的client.TaskImpl的代码。 public void execute(String codeName, byte[] code)throws RemoteException{ FileSystemClassLoader fileSystemClassLoader = null; try{ fileSystemClassLoader = new FileSystemClassLoader(); fileSystemClassLoader.execute(codeName, code); } catch(Exception exception){ throw new RemoteException(exception.getMessage()); } }
|
|