高阶函数---swift中的Filter 和 Reduce

说明

本文内容均出自函数式 Swift一书, 此处整理仅仅是为了自己日后方便查看, 需要深入研究的话, 可以点进去购买, 支持原作者本书由王巍–新浪微博大神翻译 OneV’s Den 喵神博客

上一篇写到了高阶函数—Swift中的泛型介绍(一步步实现map函数) map函数并不是Swift标准数组库中唯一一个使用泛型的函数. 趁着今天有时间, 把Filter 和 Reduce也整理一下, 方便日后查阅.

Filter

假设我们有一个由字符串组成的数组, 代表文件夹的内容:

let exampleFiles = ["README.md", "HelloWorld.swift", "FlappyBird.swift"]

现在如果我们想要一个包含所有.swift文件的数组, 可以很容易通过简单的循环得到:

func getSwiftFiles(_ files: [String]) -> [String] {
        var result: [String] = []
        for file in files {
            if file.hasSuffix(".swift") {
                result.append(file)
            }
        }
        return result
    }

现在可以使用这个函数来取得exampleFiles数组中的Swift文件

print("\(getSwiftFiles(exampleFiles))")

获取数组中的Swift文件

当然, 我们可以将getSwiftFiles函数一般化. 比如, 相比于使用硬编码(hardcoding)的方式筛选扩展名为.swift的文件, 传递一个附加的String参数进行比对会是更好的方法. 我们接下来可以使用同样的函数去比对.swift或.md文件. 但是假如我们想查找没有扩展名的所有文件, 或者是名字以字符串Hello开头的文件, 那怎么办呢?

为了进行一个这样的查找, 我们可以定义一个名为filter的通用型函数. 就像之前看到的map那样, filter函数接受一个函数作为参数. filter函数的类型是Element -> Bool ——对于数组中的所有元素, 此函数都会判定它是否应该被包含在结果中:

extension Array {
    func filter(includeElement: (Element) -> Bool) -> [Element] {
        var result: [Element] = []
        for x in self where includeElement(x) {
            result.append(x)
        }
        return result
    }
}

根据filter 能很容易地定义getSwiftFiles:

func getSwiftFiles(_ files: [String]) -> [String] {
        return files.filter(includeElement: { (file) -> Bool in
            file.hasSuffix(".swift")
        })
    }

就像map一样, Swift标准库中的数组类型已经有定义好的filter函数了. 所以除非是作为练习, 否则并没有必要重写它.

Reduce

在定义一个泛型函数来体现一个更常见的模式之前, 我们会先考虑一些相对简单的函数.

定义一个计算数组中所有整型值之和的函数非常简单:

func sum(_ xs: [Int]) -> Int {
        var result: Int = 0
        for x in xs {
            result += x
        }
        return result
    }

我们可以向下面这样使用sum函数

print(sum([1, 2, 3, 4]))

sum结果

我们也可以使用类似sum中的for循环来定义一个 product函数, 用于计算所有数组项相乘之积:

func product(_ xs: [Int]) -> Int {
        var result: Int = 1
        for x in xs {
            result = x * result
        }
        return result
    }

同样地, 我们可能想要连接数组中的所有字符串:

func concatenate(_ xs: [String]) -> String {
        var result: String = ""
        for x in xs {
            result += x
        }
        return result
    }

或者说, 我们可以选择连接数组中的所有字符串, 并插入一个单独的首行, 以及在每一项后面追加一个换行符:

func prettyPrintArray(_ xs: [String]) -> String {
        var result: String = ""
        for x in xs {
            result = " " + result + x + "\n"
        }
        return result
    }

这些函数有什么共同特点呢? 他们都将变量result初始化为某个值. 随后对输入数组 xs 的每一项进行遍历, 最后以某种方式更新结果. 为了定义一个可以体现所需类型的泛型函数, 我们需要对两份信息进行抽象: 赋给 result变量的初始值, 和用于在每一次循环中更新result的函数

考虑到这一点, 我们得出了能够匹配此模式的reduce函数定义, 如下所示:

extension Array {
    func reduce<T>(initial: T, combine: (T, Element) -> T) -> T {
        var result = initial
        for x in self {
            result = combine(result, x)
        }
        return result
    }
}

这个函数的泛型类型体现在两个方面: 对于任意的[Element]类型的输入数组来说, 它会计算一个类型为T的返回值. 这么做的前提是, 首先需要一个T类型的初始值(赋值给result变量), 以及一个用于更新for循环中变量值的函数combine:(T, Element) -> T. 在一些想OCaml 和 Haskell一样的函数式语言中, reduce函数被称为fold 或 fold_left

我们可以使用 reduce来定义以上函数. 下面是几个例子:

func sumUsingReduce(_ xs: [Int]) -> Int {
        return xs.reduce(0) { (result, x) -> Int in
            return result + x
        }
    }

除了写一个闭包, 我们也可以将运算符作为最后一个参数. 这使得代码更短, 如下面两个函数所示:

func productUsingReduce(_ xs: [Int]) -> Int {
        return xs.reduce(initial: 1, combine: *)
    }
    
    func concatUsingReduce(_ xs: [String]) -> String {
        return xs.reduce(initial: "", combine: +)
    }

需要再一次说明, 我们自定义reduce仅仅只是为了练习. Swift的标准库已经为数组提供了reduce函数

我们可以使用reduce 来定义新的泛型函数. 例如, 假设有一个数组, 它的每一项都是数组, 而我们想将他展开为一个单一数组. 可以使用for循环编写一个函数:

func flatten<T>(_ xss: [[T]]) -> [T] {
        var result: [T] = []
        for xs in xss {
            result += xs
        }
        return result
    }

然而, 若使用reduce则可以想下面这样编写这个函数:

func flattenUsingReduce<T>(_ xss: [[T]]) -> [T] {
        return xss.reduce(initial: [], combine: { (result, xs) -> [T] in
            return result + xs
        })
    }

实际上, 我们甚至可以使用reduce重新定义map 和 filter:

func mapUsingReduce<T>(_ transform: (Element) -> T) -> [T] {
        return reduce(initial: [], combine: { (result, x) -> [T] in
            return result + [transform(x)]
        })
    }
    
    func flterUsingReduce(_ includeElement:(Element) -> Bool) -> [Element] {
        return reduce(initial: [], combine: { (result, x) -> [Element] in
            return includeElement(x) ? result + [x] : result
        })
    }

我们能够使用reduce来表示所有这些函数, 这个事实说明了reduce能够通过通用的方法来体现一个相当常见的编程模式: 遍历数组并计算结果.

请务必注意: 尽管通过reduce来定义一切是个很有趣的练习, 但是在实践中者往往不是一个什么好主意. 原因在于, 不出意外的话你的代码最终会在运行期间大量复制生成的数组, 换句话说, 它不得不反复分配内存, 释放内存, 以及复制大量内存中的内容.