配色: 字号:
详解Java 8中Stream类型的“懒”加载
2016-11-09 | 阅:  转:  |  分享 
  
详解Java8中Stream类型的“懒”加载

在进入正题之前,我们需要先引入Java8中Stream类型的两个很重要的操作:

Stream类型有两种类型的方法:

中间操作(IntermediateOperation)

终结操作(TerminalOperation)

官方文档给出的描述为[不想看字母的请直接跳过]:





其实看完这个官方文档,撸主整个人是很蒙圈的,给大家讲讲官方文档这段话到底说了些什么:

第一段:流操作分为中间操作和终结操作(我就这么翻译了啊),这两种操作外加数据源就构成了所谓的pipeline,处理管道。

第二段:说中间操作会返回一个流;中间操作是懒的(lazy,究竟怎么个懒法,我们后面会讲到);还拿filter举了个例子说,执行中间操作filter的时候实际上并没有进行任何的过滤操作,而是创建了一个新的流,这个新流包含啥呢?包含的是在遍历原来流(initialstream)过程中符合筛选条件的元素(很奇怪哎,这不明显是一个过滤操作吗?怎么说没有呢);要注意的是:中间操作在pipeline执行到终结操作之前是不会开始执行的(这将在我们后面的内容中讲到);

第三段:人家说了,终结操作是eager的,也就是说,执行到终结操作的时候我就要开始遍历数据源并且执行中间操作这个过程了,不会再去等谁了。而且一旦pipeline中的终结操作完成了,那么这个pipeline的使命就完成了,如果你还有新的终结操作,那么对不起,这个旧的pipeline就用不了了,你得新建一个stream,然后在造一遍轮子。这里有一句话我实在没弄明白什么意思啊,"

",还希望道友们帮忙解释一下,感激不尽!

第四段:夸了一下stream“懒”执行的好处:效率高。将中间操作融合在一起,使操作对对象的状态改变最小化;而且还能使我们避免一些没必要的工作,给了个例子:在一堆字符串里要找出第一个含超过1000个字符的字符串,通过streamoperation的laziness那么我们就不用遍历全部元素了,只需执行能找出满足条件的元素的操作就行(其实这个需求不通过streampipeline也能做到不是吗?);其实最重要的还是当面对一个无限数据源的操作时,它的不可替代性才体现了出来,因为经典java中collection是finite的,当然这个不是我们今天的目标,这里就不拓展开讲了。

愿文档后面还有一点内容,讲了中间操作有的是持有状态的(stateful),有的是无状态的(stateless),他们在对原数据的遍历上也有一些不同感兴趣的同学可自己去研究研究,我们今天主要还是看看中间操作是怎么个“懒”法以及这个“懒”的过程是怎么样的。

Stream之所以“懒”的秘密也在于每次在使用Stream时,都会连接多个中间操作,并在最后附上一个结束操作。像map()和filter()这样的方法是中间操作,在调用它们时,会立即返回另一个Stream对象。而对于reduce()及findFirst()这样的方法,它们是终结操作,在调用它们时才会执行真正的操作来获取需要的值。

比如,当我们需要打印出第一个长度为3的大写名字时:





你可能认为以上的代码会对names集合进行很多操作,比如首先遍历一次集合得到长度为3的所有名字,再遍历一次filter得到的集合,将名字转换为大写。最后再从大写名字的集合中找到第一个并返回。这也是经典情况下JavaEager处理的角度。此时的处理顺序是这样的

对于Stream操作,更好的代码阅读顺序是从右到左,或者从下到上。每一个操作都只会做到恰到好处。如果以Eager的视角来阅读上述代码,它也许会执行15步操作:



?

?

可是实际情况并不是这样,不要忘了Stream可是非常“懒”的,它不会执行任何多余的操作。实际上,只有当findFirst方法被调用时,filter和map方法才会被真正触发。而filter也不会一口气对整个集合实现过滤,它会一个个的过滤,如果发现了符合条件的元素,会将该元素置入到下一个中间操作,也就是map方法中。所以实际的情况是这样的:

\

?

控制台的输出是这样的:

为了更好理解上述过程,我们将Lambda表达式换为经典的Java写法,即匿名内部类的形式:





执行的见下图:

?



很容易得出之前的结论:只有当findFirst方法被调用时,filter和map方法才会被真正触发。而filter也不会一口气对整个集合实现过滤,它会一个个的过滤,如果发现了符合条件的元素,会将该元素置入到下一个中间操作,也就是map方法中。

当终结操作获得了它需要的答案时,整个计算过程就结束了。如果没有获得到答案,那么它会要求中间操作对更多的集合元素进行计算,直到找到答案或者整个集合被处理完毕。

JDK会将所有的中间操作合并成一个,这个过程被称为熔断操作(FusingOperation)。因此,在最坏的情况下(即集合中没有符合要求的元素),集合也只会被遍历一次,而不会像我们想象的那样执行了多次遍历,也许这就回答了官方文档中为什么说"Processingstreamslazilyallowsforsignificantefficiencies"了。

为了看清楚在底层发生的事情,我们可以将以上对Stream的操作按照类型进行分割:





//输出结果//Streamcreated,filtered,mapped...//readytocallfindFirst...//gettinglengthforBrad//gettinglengthforKate//gettinglengthforKim//convertingtouppercase:Kim//KIM



献花(0)
+1
(本文系thedust79首藏)