Haskell函数式编程之特性篇
函数式编程的定义是:
In computer science, functional programming is a programming paradigm that treats computation as the evaluation of mathematical functions and avoids stateand mutable data.
即:函数式编程是一种编程模型,他将计算机运算看做是数学中函数的计算,并且避免了引入状态及可变数据。
它更强调函数的应用,而不像命令式编程更强调状态的改变。
无副作用(side effect)
命令式函数可能会改变程序的状态,这就会对其产生副作用。在命令式编程中,在执行程序不同的状态下同一个函数的返回结果会发生改变。例如,下面是一个使用JavaScript写的函数。
1 |
|
1 |
|
注意我们调用了两次getVal(),但是其输出了不同的结果。而在Haskell中,对变量只有声明,没有赋值。即如果声明了一个值为true的state变量,就无法再将其修改为false。这叫做变量的不变性。
而函数式编程中如果描述状态的变化那,就是将状态变化作为函数的参数进行传递。
延迟计算(lazy evaluation)
正因为函数式编程无副作用,所以延迟计算(又称为惰性求值)就成为可能。
延迟计算指将一个表达式的值推迟到直到被需要时才进行计算。(delays the evaluation of an expression until its value is needed )
它的优点是:
- 避免了不需要的运算,从而提高的性能。
- 使创建无限的数据结构成为可能。
例如,我们写一个将指定参数放置到一个无限长的数组中的函数。
1 |
|
第一行是对repeat’参数及返回值的定义,它接收一个类型a,返回a的数组。
第二行是repeat’函数的实现,它将x放置到一个无穷大的数组中。
在没有延迟计算特性的编程语言中,这种函数是根本无法使用的。因为一旦调用就会陷入死循环。
即使在支持延迟计算的编程语言中,我们直接输出这个数组:print $ repeat' 10
,也会进入死循环。那么如何使用它那?我们可以写一个take函数,其可以返回数组中前几位元素。
1 | take' :: Int -> [a] -> [a] |
我们这样调用它,
1 |
|
Haskell对函数参数默认采取延迟计算的求值策略。所以这样在调用repeat’函数时并不是先将repeat’函数的结果数组计算出来,再进行take操作,而是take操作需要前几位元素,repeat’函数才会生成前几位元素。
高阶函数(Higher-order function)
一个函数成为高阶函数需要满足下面两条中的至少一条:
- 将一个或多个函数作为输入。
- 输出是一个函数。
换句话说,高阶函数就是将函数作为参数或者作为返回值的函数。其他函数都成为一阶函数(first order function)。其实这个概念最早来源于数学领域。
函数是Haskell世界中的一等公民,所以肯定支持高阶函数。举个例子,Haskell中有个map函数,它的定义是这样的:
map:: (a -> b) -> [a] -> [b]
它的作用是传入一个函数及一个数组,对该数组中的每一个元素应用此函数,从而转换为另一个数组。
我们可以自己实现一个map函数。
1 |
|
map’函数接收两个参数,第一个参数是一个函数,该函数输入值为a类型的值,输出值为b类型的值,第二个参数为源数组。
我们调用ma p’函数时,可以直接写一个lambda表达式,对源数组进行各种操作。
1 |
|
如果我们有这样一个需求,我们想通过map’函数对数组的每个对象都加上一个值n,这个n我不想直接定义在此lambda表达式中,能实现吗?答案是可以。
1 |
|
对于匿名函数(\x -> x + n)来说,n就是non-local variable。什么是non-local variable那?如果一个函数使用了一个变量,这个变量既不属于全局变量,也不属于在此函数中定义的变量,那这个变量对于此函数来说就是non-local variable。
所谓的闭包就是使用了non-local variable的函数。
curry function
curry function还真比较难翻译,先看看wiki百科的翻译:
In mathematics and computer science, currying is the technique of transforming a function that takes multiple arguments (or a tuple of arguments) in such a way that it can be called as a chain of functions, each with a single argument (partial application).
在数学领域和计算机科学领域,currying是一项将接收多个参数(或参数元组)函数转换为函数的链式调用的技术,链条中的每个函数接收单个参数。
这句话看起来真费解。那么我用一个例子说明一个。
假设现在有一个函数为f(x,y) = x/y
。那么f(2,3)
的执行过程是什么样的那? 首先,我们将x替换为2.那么得到了f(2,y) = 2/y
。我们定义一个新的函数g(y)= f(2,y) = 2/y
。再将y替换成3,那么得到了g(3) = f(2,3) = 2/3
。这个g(y)
函数就是f(x,y)
的一个curried function.
举个例子。上文中我们构造了一个map’函数,它接收一个函数及一个数组。如果我们想实现一个名为doubleMe的函数,它接收一个数组,将数组中每个元素都翻一倍。这个可以这样写:
1 |
|
注意看,定义doubleMe时我们使用了map’函数,但是给map’函数只传递了一个参数,并没有提供第二个参数。所以在调用doubleMe时,要给其传递一个数组。
1 |
|
doubleMe的函数完全等价于:
1 |
|
换句话说,如果一个函数接收多个参数,那么接收部分参数的该函数也是一个函数。