分享

Scala 中 10 个超赞的集合操作函数

 青叶i生活 2018-02-01

 当我处理 Scala 集合时,我会进行两类操作:转换操作和聚合操作。第一种操作类型将集合转换为另一个集合,第二种操作类型返回某些类型的值。

本文我将集中介绍几个日常工作必备的 Scala 集合函数,如转换函数和聚合函数。文章最后,我会展示如何结合这些函数以解决具体问题。

#1 最大值和最小值

我们先从动作函数开始。

在序列中查找最大或最小值是一个极常见的需求,较常用于面试问题和算法。还记得 Java 中的代码行吗?如下:

  1. int[] arr = {11, 2, 5, 1, 6, 3, 9};   
  2. int to = arr.length - 1;   
  3. int max = arr[0];   
  4. for (int i = 0; i < to; i++)   
  5. { if (max < arr[i+1]) max = arr[i+1]; }   
  6. System.out.println(max);  

问题:怎么在 List 中找到最大/最小值呢?

Scala 推荐了一个很赞的解决方案:

  1. val numbers = Seq(11, 2, 5, 1, 6, 3, 9)   
  2.   numbers.max //11   
  3.   numbers.min //1  

但实际操作的数据更加复杂。下面我们介绍一个更高级的例子,其中包含一个书的序列(查看源代码案例)。

  1. case class Book(title: String, pages: Int)   
  2.   val books = Seq( Book("Future of Scala developers", 85),   
  3.                   Book("Parallel algorithms", 240),   
  4.                   Book("Object Oriented Programming", 130),   
  5.                   Book("Mobile Development", 495) )   
  6.   //Book(Mobile Development,495)   
  7.   books.maxBy(book => book.pages)   
  8.   //Book(Future of Scala developers,85)   
  9.   books.minBy(book => book.pages)  

如上所示,minBy & maxBy 方法解决了复杂数据的问题。你只需选择决定数据最大或最小的属性。

#2 过滤

你过滤过集合吗?比如,筛选价格大于10美元的条目,或挑选年龄在24岁以下员工等,所有这些操作属于过滤。

让我们举例说明:过滤一个数字 List,只获取奇数的元素。

  1. val numbers = Seq(1,2,3,4,5,6,7,8,9,10) numbers.filter(n => n % 2 == 0)  

然后加大难度,我想获取页数大于120页的书。

  1. val books = Seq( Book("Future of Scala developers", 85),   
  2.                  Book("Parallel algorithms", 240),   
  3.                  Book("Object Oriented Programming", 130),   
  4.                  Book("Mobile Development", 495) )   
  5.    books.filter(book => book.pages >= 120)  

实际上,过滤是一个转换类型的方法,但是比运用 min 和 max 方法简单。

还有一个与 filter 类似的方法是 filterNot。它的名字就体现了它的作用。如果你还是不了解它的实际用途,你可以在一个示例中,用 filterNot 替换 filter 方法。

#3 Flatten O_o

我想大多数朋友都没听说过这个功能。其实它很好理解,我们来举例说明:

  1. val abcd = Seq('a', 'b', 'c', 'd')   
  2.    val efgj = Seq('e', 'f', 'g', 'h')   
  3.    val ijkl = Seq('i', 'j', 'k', 'l')   
  4.    val mnop = Seq('m', 'n', 'o', 'p')   
  5.    val qrst = Seq('q', 'r', 's', 't')   
  6.    val uvwx = Seq('u', 'v', 'w', 'x')   
  7.    val yz = Seq('y', 'z')   
  8.    val alphabet = Seq(abcd, efgj, ijkl, mnop, qrst, uvwx, yz)   
  9.    //   
  10.   // List(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t,  
  11.   //      u, v, w, x, y, z)   
  12.    alphabet.flatten  

当有一个集合的集合,然后你想对这些集合的所有元素进行操作时,就会用到 flatten。

#4 Euler Diagram 函数

[译者注:Euler Diagram 可以翻译为欧拉图,但请注意与 Euler Graph 的区别。Euler Diagram 用于描述集合及集合间的关系,而 Euler Graph 描述的是一种“图”这样的数据结构]

不要紧张!接下来的操作大家都熟知:差集、交集和并集。以下示例能很好地解释 Euler Diagram 函数:

  1. val num1 = Seq(1, 2, 3, 4, 5, 6)   
  2.    val num2 = Seq(4, 5, 6, 7, 8, 9)   
  3.    //List(1, 2, 3)   
  4.    num1.diff(num2)   
  5.    //List(4, 5, 6)   
  6.    num1.intersect(num2)   
  7.    //List(1, 2, 3, 4, 5, 6, 4, 5, 6, 7, 8, 9)   
  8.    num1.union(num2)  

上述示例中的 union 保留了重复的元素。如果我们不需要重复怎么办?这时可以使用 distinct 函数:

  1. //List(1, 2, 3, 4, 5, 6, 7, 8, 9)   
  2. num1.union(num2).distinct  

下面是上述功能的图示:


#5 map(映射)列表元素

map 是 Scala 集合最常用的一个函数。它的功能十分强大:

  1. val numbers = Seq(1,2,3,4,5,6)   
  2.    //List(2, 4, 6, 8, 10, 12)   
  3.    numbers.map(n => n * 2)   
  4.    val chars = Seq('a', 'b', 'c', 'd')   
  5.    //List(A, B, C, D)   
  6.    chars.map(ch => ch.toUpper)  

map 函数的逻辑是遍历集合中的元素并对每个元素调用函数。你也可以不调用任何函数,保持返回元素本身,但这样 map 无法发挥作用,因为你在映射过后得到的是同样的集合。

#6 flatMap

我很难具体说明 flatMap 的使用场合,因为很多不同的情况下都会用到 flatMap。如果大家仔细观察,就会发现 flatMap 是由下列这两个函数组成的:

map & flatten

现在,假设我们想知道字母表中的大写字母和小写字母的排列情况:

  1. val abcd = Seq('a', 'b', 'c', 'd')   
  2.   //List(A, a, B, b, C, c, D, d)   
  3.   abcd.flatMap(ch => List(ch.toUpper, ch))  

因为这篇文章是关于集合功能的介绍,所以此处略过 Future 和 Option 的示例。

#7 对整个集合进行条件检查

有一个场景大家都知道,即确保集合中所有元素都要符合某些要求,如果有哪怕一个元素不符合条件,就需要进行一些处理:

  1. val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)   
  2.   //ture numbers.forall(n => n < 10)   
  3.   //false numbers.forall(n => n > 5)  

而 forall 函数就是为处理这类需求而创建的。

#8 对集合进行分组

你是否尝试过将一个集合按一定的规则拆分成两个新的集合?比如,我们把某个集合拆分成偶数集和奇数集,partition 函数可以帮我们做到这一点:

  1. val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)   
  2.    //(List(2, 6, 4, 2), List(3, 7, 9, 5, 1))   
  3.    numbers.partition(n => n % 2 == 0)  

#9 Fold?

另一个流行的操作是 fold。 在 Scala 的上下文中,通常可以考虑 foldLeft 和 foldRight。他们是从不同的方面做同样的工作: 

  1. val numbers = Seq(1, 2, 3, 4, 5)   
  2. //15 numbers.foldLeft(0)((res, n) => res + n)  

在第一对括号中,我们放一个起始值。 在第二对括号中,我们定义需要对数字序列的每个元素执行的操作。 第一步,n = 0,然后它根据序列元素变化。

另一个关于 foldLeft 的例子,计算字符数:

  1. val words = Seq("apple", "dog", "table")   
  2.    //13 words.foldLeft(0)((resultLength, word) => resultLength + word.length)  




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多