7.1.1 map/reduce
Python內建了map()
和reduce()
函數。
如果你讀過Google的那篇大名鼎鼎的論文“MapReduce: Simplified Data Processing on Large Clusters”,你就能大概明白map/reduce的概念。
我們先看map。map()
函數接收兩個參數,一個是函數,一個是Iterable
,map
將傳入的函數依次作用到序列的每個元素,并把結果作為新的Iterator
返回。
舉例說明,比如我們有一個函數,要把這個函數作用在一個list?
[1, 2, 3, 4, 5, 6, 7, 8, 9]
上,就可以用map()
實現如下:

現在,我們用Python代碼實現:
map()
傳入的第一個參數是f
,即函數對象本身。由于結果r
是一個Iterator
,Iterator
是惰性序列,因此通過list()
函數讓它把整個序列都計算出來并返回一個list。
你可能會想,不需要map()
函數,寫一個循環(huán),也可以計算出結果:
的確可以,但是,從上面的循環(huán)代碼,能一眼看明白“把f(x)作用在list的每一個元素并把結果生成一個新的list”嗎?
所以,map()
作為高階函數,事實上它把運算規(guī)則抽象了,因此,我們不但可以計算簡單的,還可以計算任意復雜的函數,比如,把這個list所有數字轉為字符串:
只需要一行代碼。
再看reduce
的用法。reduce
把一個函數作用在一個序列[x1, x2, x3, ...]
上,這個函數必須接收兩個參數,reduce
把結果繼續(xù)和序列的下一個元素做累積計算,其效果就是:
比方說對一個序列求和,就可以用reduce
實現:
當然求和運算可以直接用Python內建函數sum()
,沒必要動用reduce
。
但是如果要把序列[1, 3, 5, 7, 9]
變換成整數13579
,reduce
就可以派上用場:
這個例子本身沒多大用處,但是,如果考慮到字符串str
也是一個序列,對上面的例子稍加改動,配合map()
,我們就可以寫出把str
轉換為int
的函數:
整理成一個str2int
的函數就是:
還可以用lambda函數進一步簡化成:
也就是說,假設Python沒有提供int()
函數,你完全可以自己寫一個把字符串轉化為整數的函數,而且只需要幾行代碼!
lambda函數的用法在后面介紹。