7.1.1 map/reduce

2021-09-06 16:56 作者:海鷗之道 0人讀過 | 我要投稿

Python內建了map()和reduce()函數。

如果你讀過Google的那篇大名鼎鼎的論文“MapReduce: Simplified Data Processing on Large Clusters”，你就能大概明白map/reduce的概念。

我們先看map。map()函數接收兩個參數，一個是函數，一個是Iterable，map將傳入的函數依次作用到序列的每個元素，并把結果作為新的Iterator返回。

舉例說明，比如我們有一個函數 $f(x)%3Dx%5E2%20$ ，要把這個函數作用在一個list?[1, 2, 3, 4, 5, 6, 7, 8, 9]上，就可以用map()實現如下：

現在，我們用Python代碼實現：

map()傳入的第一個參數是f，即函數對象本身。由于結果r是一個Iterator，Iterator是惰性序列，因此通過list()函數讓它把整個序列都計算出來并返回一個list。

你可能會想，不需要map()函數，寫一個循環(huán)，也可以計算出結果：

的確可以，但是，從上面的循環(huán)代碼，能一眼看明白“把f(x)作用在list的每一個元素并把結果生成一個新的list”嗎？

所以，map()作為高階函數，事實上它把運算規(guī)則抽象了，因此，我們不但可以計算簡單的 $f(x)%20%3D%20x%5E2$ ，還可以計算任意復雜的函數，比如，把這個list所有數字轉為字符串：

只需要一行代碼。

再看reduce的用法。reduce把一個函數作用在一個序列[x1, x2, x3, ...]上，這個函數必須接收兩個參數，reduce把結果繼續(xù)和序列的下一個元素做累積計算，其效果就是：

比方說對一個序列求和，就可以用reduce實現：

當然求和運算可以直接用Python內建函數sum()，沒必要動用reduce。

但是如果要把序列[1, 3, 5, 7, 9]變換成整數13579，reduce就可以派上用場：

這個例子本身沒多大用處，但是，如果考慮到字符串str也是一個序列，對上面的例子稍加改動，配合map()，我們就可以寫出把str轉換為int的函數：

整理成一個str2int的函數就是：

還可以用lambda函數進一步簡化成：

也就是說，假設Python沒有提供int()函數，你完全可以自己寫一個把字符串轉化為整數的函數，而且只需要幾行代碼！

lambda函數的用法在后面介紹。

標簽：

7.1.1 map/reduce的評論 (共條)