函数式编程里面的fold

王云tncc0kikyz 2016-06-11

展开全文

第一：基本概念

fold在函数式编程里面的基本含义是遍历数据结构，最后产生一个聚合值。最简单的例子是sum list = foldl (+) 0 list

fold抽象了两个动作，一个是遍历数据结构本身，一个是累积值和元素之间的关系。用了fold后就只需要关心聚合的初始值是什么，每个元素和累积值如何产生下一个累积值。

比如上面的sum的例子，初始值是0，步进函数+，也就是每个元素和累计值相加产生下一个累计值。

第二：foldl 和 foldr

foldl :: (acc -> e -> acc) -> acc -> [e] -> acc

e:element 数据结构中的其中一个元素，acc:accumulator 累积值

(acc->e->acc) 步进函数

foldl 的遍历是从第一个元素开始，到最后一个元素结束。累积值首先和第一个元素应用步进函数。

foldr :: (e -> acc -> acc) -> acc -> [e] -> acc

(e->acc->acc) 步进函数

foldl 的遍历是从最后一个元素开始，到第一个结束。累积值首先和最后一个元素应用步进函数。

两个的步进函数的签名是有区别的。

第三：惰性求值

假定数据结构为列表 [x1,x2,x3]

在scala里面，foldl是尾递归的，因为step 函数产生的下一个accumulator作为下一次step的函数的参数，因此每个accumulator都会被先求值出来。这样迭代就只需要两个状态，一个是上一次的accumulator，一个是当前的元素，这样直接覆盖就可以了。

但是如果是惰性求值的语言，step函数的两个参数之一的accumulator被保持为表达式，并未求值，那么这个表达式一直在stack上保存step函数，因此最后的表达式是

step(step(step(init,x1),x2),x3)。如果数据结构的深度很大，必然造成堆栈溢出。

在非惰性求值的语言里面，foldr是可能造成堆栈溢出的。因为foldr最后生成的表达式是step(x1,step(x2,step(x3,init))),只有当表达式完全展开之后，step(x3,init)开始得到求值结果之后才会一级一级的退栈。

但是在惰性求值的语言里面，foldr是否会造成堆栈溢出和step函数本身关系很大。如果step函数在步进的过程中因为判断元素的属性而提前退出，不需要继续求值后面的step(x2,step(x3,init))，那么就可能不会堆栈溢出（看提前退出前的数据量的大小了）。

对于sum这个函数，在惰性求值语言语言如Haskell里面foldr，foldl在列表元素够大的情况下都会溢出，在scala语言里面，foldl不会溢出，而foldr会溢出。

第四：惰性数据结构

foldr在惰性数据结构的配合下可以做到效率和模块化的完美分离。

对于表达式List(1,3,5,7).map(_+2).filter(_ % 2==1).sum，可能对效率要求比较高的人就不能接受，因为会遍历列表3次。但是不得不承认的是这个代码的易读和可理解性是很好的。如果为了效率把遍历减少到一次，可能需要读完整个代码才能理解这段代码做了什么事情。

但是利用惰性数据结构来说，是完全可以做到鱼与熊掌兼得的。

第五：总结

fold是典型的函数式语言里面的抽象再抽象的例子，有了fold之后比如list函数基本都可以构建在他之上了（对于消费list的函数）。

对于产生list的函数来说，对应的也有unfold。（待续了）

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：王云tncc0kikyz > 《电脑》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

王云tncc0kikyz

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换