无论怎样,基于android的设备也是嵌入式设备。现代的手持设备,与其说是电话,更像一台拿在手中的电脑。但是,即使是“最快”的手持设备,其性能也达不到一台普通的台式电脑。 这就是为什么我们在书写Android应用程序的时候要格外关注效率。这些设备并没有那么快,并且受电池电量的制约。这意味着,设备没有更多的能力,我们必须把程序写的尽量有效。 本文讨论了很多能让开发者使他们的程序运行更有效的方法,遵照这些方法,你可以使你的程序发挥最大的效力。 引言对于占用资源的系统,有两条基本原则:
所有下面的内容都遵照这两个原则。 有些人可能马上会跳出来,把本节的大部分内容归于“草率的优化”,不可否认微优化的确会带来很多问题,诸如无法使用更有效的数据结构和算法。但 是在手持设备上,你别无选择。假如你认为Android虚拟机的性能与台式机相当,你的程序很有可能一开始就占用了系统的全部内存,这会让你的程序慢得像 蜗牛一样,更遑论做其他的操作了。 Android的成功依赖于你的程序提供的用户体验。而这种用户体验,部分依赖于你的程序是响应快速而灵活的,还是响应缓慢而僵化的。因为所有 的程序都运行在同一个设备之上,都在一起,这就如果在同一条路上行驶的汽车。而这篇文档就相当于你在取得驾照之前必须要学习的交通规则。如果大家都按照这 些规则去做,驾驶就会很顺畅,但是如果你不这样做,你可能会车毁人亡。这就是为什么这些原则十分重要。 当我们讨论实质性问题之前,还必须要提醒大家一点:不管VM是否支持实时(JIT)编译器,下面提到的这些原则都是成立的。假如我们有目标完全 相同的两个方法,在解释执行时foo()比bar()快,那么编译之后,foo()依然会比bar()快。所以不要寄希望于编译器可以拯救你的程序。 避免建立对象世界上没有免费的对象。虽然GC为每个线程都建立了临时对象池,可以使创建对象的代价变得小一些,但是分配内存永远都比不分配内存的代价大。 如果你在用户界面循环中分配对象内存,就会引发周期性的垃圾回收,用户就会觉得界面像打嗝一样一顿一顿的。 所以,除非必要,应尽量避免尽力对象的实例。下面的例子将帮助你理解这条原则:
一个更极端的例子是,把多维数组分成多个一维数组:
总体来说,就是避免创建短命的临时对象。减少对象的创建就能减少垃圾收集,进而减少对用户体验的影响。 使用本地方法当你在处理字串的时候,不要吝惜使用String.indexOf(), String.lastIndexOf()等特殊实现的方法。这些方法都是使用C/C++实现的,比起Java循环快10到100倍。 但也并非要完全使用本地方法,调用本地方法的代价要高于调用解释方法。所以如果可以避免,就不应使用本地方法去做一些并不复杂的运算。 选择虚类而不是接口假设你有一个HashMap对象,你可以将它声明为HashMap或者Map: Map myMap1 = new HashMap(); HashMap myMap2 = new HashMap(); 哪个更好呢? 按照传统的观点Map会更好些,因为这样你可以改变他的具体实现类,只要这个类继承自Map接口。传统的观点对于传统的程序是正确的,但是它并不适合嵌入式系统。调用一个接口的引用会比调用实体类的引用多花费一倍的时间。 如果HashMap完全适合你的程序,那么使用Map就没有什么价值。如果有些地方你不能确定,先避免使用Map,剩下的交给IDE提供的重构功能好了。(当然公共API是一个例外:一个好的API常常会牺牲一些性能) 用静态方法比虚方法好如果你不需要访问一个对象的成员变量,那么请把方法声明成static。虚方法执行的更快,因为它可以被直接调用而不需要一个虚函数表。另外你也可以通过声明体现出这个函数的调用不会改变对象的状态。 不用getter和setter在很多本地语言如C++中,都会使用getter(比如:i = getCount())来避免直接访问成员变量(i = mCount)。在C++中这是一个非常好的习惯,因为编译器能够内联访问,如果你需要约束或调试变量,你可以在任何时候添加代码。 在Android上,这就不是个好主意了。虚方法的开销比直接访问成员变量大得多。在通用的接口定义中,可以依照OO的方式定义getters和setters,但是在一般的类中,你应该直接访问变量。 将成员变量缓存到本地访问成员变量比访问本地变量慢得多,下面一段代码: for (int i = 0; i < this.mCount; i++) dumpItem(this.mItems[i]); 你应该写成: int count = this.mCount; Item[] items = this.mItems; for (int i = 0; i < count; i++) dumpItems(items[i]); (显示的使用"this"是为了表明这些是成员变量) 另一个相似的原则是:永远不要在for的第二个条件中调用任何方法。如下面方法所示,在每次循环的时候都会调用getCount()方法,这样做比你在一个int先把结果保存起来开销大很多。 for (int i = 0; i < this.getCount();i++) dumpItems(this.getItem(i)); 同样如果你要多次访问一个变量,也最好先为它建立一个本地变量,例如: protected void drawHorizontalScrollBar(Canvas canvas, int width, int height) { if (isHorizontalScrollBarEnabled()) { int size = mScrollBar.getSize(false); if (size <= 0) { size = mScrollBarSize; } mScrollBar.setBounds(0, height - size, width, height); mScrollBar.setParams( computeHorizontalScrollRange(), computeHorizontalScrollOffset(), computeHorizontalScrollExtent(), false); mScrollBar.draw(canvas); } } 这里有4次访问成员变量mScrollBar,如果将它缓存到本地,4次成员变量访问就会变成4次效率更高的栈变量访问。 顺便说明一下,就是方法的参数与本地变量的性能是相同的。 使用常量让我们来看看这两段在类前面的声明: static int intVal = 42; static String strVal = "Hello, world!"; 编译器会生成一个叫做<clinit>的初始化类的方法,当类第一次被使用的时候这个方法会被执行。方法会将42赋给intVal,然后把一个指向类中常量表的引用赋给strVal。当以后要用到这些值的时候,会在成员变量表中查找到他们。 我们可以做一些改进,使用“final"关键字: static final int intVal = 42; static final String strVal = "Hello, world!"; 现在,类不再需要<clinit>方法,因为在成员变量初始化的时候,会将常量直接保存到类文件中。用到intVal的代码被直接替换成42,而使用strVal的会指向一个字符串常量,而不是使用成员变量。 将一个方法或类声明为"final"不会带来性能的提升,但是会帮助编译器优化代码。举例说,如果编译器知道一个"getter"方法不会被重载,那么编译器会对其采用内联调用。 你也可以将本地变量声明为"final",同样,这也不会带来性能的提升。使用"final"只能使本地变量看起来更清晰些(但是也有些时候这是必须的,比如在使用匿名内部类的时候)。 谨慎使用foreachforeach可以用在实现了Iterable接口的集合类型上。foreach会给这些对象分配一个iterator,然后调用 hasNext()和next()方法。你最好使用foreach处理ArrayList对象,但是对其他集合对象,foreach相当于使用 iterator。 下面展示了foreach一种可接受的用法: public class Foo { int mSplat; static Foo mArray[] = new Foo[27]; public static void zero() { int sum = 0; for (int i = 0; i < mArray.length; i++) { sum += mArray[i].mSplat; } } public static void one() { int sum = 0; Foo[] localArray = mArray; int len = localArray.length; for (int i = 0; i < len; i++) { sum += localArray[i].mSplat; } } public static void two() { int sum = 0; for (Foo a: mArray) { sum += a.mSplat; } } } 在zero()中,每次循环都会访问两次静态成员变量,取得一次数组的长度。 在one()中,将所有成员变量存储到本地变量。 在two()中,使用了在java1.5中引入的foreach语法。编译器会将对数组的引用和数组的长度 保存到本地变量中,这对访问数组元素非常好。但是编译器还会在每次循环中产生一个额外的对本地变量的存储操作(对变量a的存取)这样会比one()多出4 个字节,速度要稍微慢一些。 综上所述,当foreach在访问array时性能很好,但是运用于其他集合对象时要小心,因为它会产生额外的对象。 避免使用枚举枚举变量非常方便,但不幸的是它会牺牲执行的速度并会大幅增加文件体积。例如: public class Foo { public enum Shrubbery { GROUND, CRAWLING, HANGING } } 会产生一个900字节的.class文件(Foo$Shubbery.class)。在它被首次调用时,这个类会调用初始化方法来准备每个枚举 变量。每个枚举项都会被声明成一个静态变量,并被赋值。然后将这些静态变量放在一个名为"$VALUES"的静态数组变量中。而这么一大堆代码,仅仅是为 了使用三个整数。 如此Shrubbery shrub = Shrubbery.GROUND;会声明一个对静态变量的引用,如果这个静态变量是final int,那么编译器会直接内联这个常数。 一方面说,使用枚举变量可以让你的API更出色,并能提供编译时的检查。所以在通常的时候你毫无疑问应该为公共API选择枚举变量。但是当性能方面有所限制的时候,你就应该避免这种做法了。 有些情况下,使用ordinal()方法获取枚举变量的整数值会更好一些,举例来说,将: for (int n = 0; n < list.size(); n++) { if (list.items[n].e == MyEnum.VAL_X) // do stuff 1 else if (list.items[n].e == MyEnum.VAL_Y) // do stuff 2 } 替换为: int valX = MyEnum.VAL_X.ordinal(); int valY = MyEnum.VAL_Y.ordinal(); int count = list.size(); MyItem items = list.items(); for (int n = 0; n < count; n++) { int valItem = items[n].e.ordinal(); if (valItem == valX) // do stuff 1 else if (valItem == valY) // do stuff 2 } 会使性能得到一些改善,但这并不是最终的解决之道。 将内部类声明在包作用域内考虑如下的类定义: public class Foo { private int mValue; public void run() { Inner in = new Inner(); mValue = 27; in.stuff(); } private void doStuff(int value) { System.out.println("Value is " + value); } private class Inner { void stuff() { Foo.this.doStuff(Foo.this.mValue); } } } 这其中的关键是,我们定义了一个内部类(Foo$Inner),它需要访问外部类的私有域变量和函数。这是合法的,并且会打印出我们希望的结果"Value is 27"。 问题是在技术上来讲(在幕后)Foo$Inner是一个完全独立的类,它要直接访问Foo的私有成员是非法的。要跨越这个鸿沟,编译器需要生成一组方法: /*package*/ static int Foo.access$100(Foo foo) { return foo.mValue; } /*package*/ static void Foo.access$200(Foo foo, int value) { foo.doStuff(value); } 内部类在每次访问"mValue"和"doStuff"方法时,都会调用这些静态方法。就是说,上面的代码说明了一个问题,你是在通过接口方法 访问这些成员变量和函数而不是直接调用它们。在前面我们已经说过,使用接口方法(getter、setter)比直接访问速度要慢。所以这个例子就是在特 定语法下面产生的一个“隐性的”性能障碍。 通过将内部类访问的变量和函数声明由私有范围改为包范围,我们可以避免这个问题。这样做可以让代码运行更快,并且避免产生额外的静态方法。(遗 憾的是,这些域和方法可以被同一个包内的其他类直接访问,这与经典的OO原则相违背。因此当你设计公共API的时候应该谨慎使用这条优化原则) 避免使用浮点数在奔腾CPU出现之前,游戏设计者做得最多的就是整数运算。随着奔腾的到来,浮点运算处理器成为了CPU内置的特性,浮点和整数配合使用,能够让你的游戏运行得更顺畅。通常在桌面电脑上,你可以随意的使用浮点运算。 但是非常遗憾,嵌入式处理器通常没有支持浮点运算的硬件,所有对"float"和"double"的运算都是通过软件实现的。一些基本的浮点运算,甚至需要毫秒级的时间才能完成。 甚至是整数,一些芯片有对乘法的硬件支持而缺少对除法的支持。这种情况下,整数的除法和取模运算也是有软件来完成的。所以当你在使用哈希表或者做大量数学运算时一定要小心谨慎。 性能分析实例数据为了说明我们的一些想法,这里是一个表中列出了一些基本的行为的近似的运行时间。值得注意的是所有这些的数据不应被视为绝对精确,他们是由 CPU和钟表得出的结果,而且将随着系统的改进而产生变化。然而,值得注意的是如何将这些值彼此匹配——举例来说,目前加入一个成员变量所耗费时间是增加 一个本地变量的四倍左右。
结束语为嵌入式系统编写正确高效的代码的最佳的方法就是去理解你的代码究竟要做什么。如果你的确想要分配一个迭代器或者无论如何都要在Lists上面 使用增强循环语法,那么一定是深思熟虑后的选择,而不是一个不小心心的副作用。凡事预则立,不预则废。一定要知道你在做什么。按照你自己的风格去编写代 码,但一定要仔细考虑代码所作的事,并找到提升速度的方法。 |
|