13.5 分布式進程
在Thread和Process中,應當優(yōu)選Process,因為Process更穩(wěn)定,而且,Process可以分布到多臺機器上,而Thread最多只能分布到同一臺機器的多個CPU上。
Python的multiprocessing
模塊不但支持多進程,其中managers
子模塊還支持把多進程分布到多臺機器上。一個服務進程可以作為調度者,將任務分布到其他多個進程中,依靠網絡通信。由于managers
模塊封裝很好,不必了解網絡通信的細節(jié),就可以很容易地編寫分布式多進程程序。
舉個例子:如果我們已經有一個通過Queue
通信的多進程程序在同一臺機器上運行,現(xiàn)在,由于處理任務的進程任務繁重,希望把發(fā)送任務的進程和處理任務的進程分布到兩臺機器上。怎么用分布式進程實現(xiàn)?
原有的Queue
可以繼續(xù)使用,但是,通過managers
模塊把Queue
通過網絡暴露出去,就可以讓其他機器的進程訪問Queue
了。
我們先看服務進程,服務進程負責啟動Queue
,把Queue
注冊到網絡上,然后往Queue
里面寫入任務:
請注意,當我們在一臺機器上寫多進程程序時,創(chuàng)建的Queue
可以直接拿來用,但是,在分布式多進程環(huán)境下,添加任務到Queue
不可以直接對原始的task_queue
進行操作,那樣就繞過了QueueManager
的封裝,必須通過manager.get_task_queue()
獲得的Queue
接口添加。
然后,在另一臺機器上啟動任務進程(本機上啟動也可以):
任務進程要通過網絡連接到服務進程,所以要指定服務進程的IP。
現(xiàn)在,可以試試分布式進程的工作效果了。先啟動task_master.py
服務進程:
task_master.py
進程發(fā)送完任務后,開始等待result
隊列的結果?,F(xiàn)在啟動task_worker.py
進程:
task_worker.py
進程結束,在task_master.py
進程中會繼續(xù)打印出結果:
這個簡單的Master/Worker模型有什么用?其實這就是一個簡單但真正的分布式計算,把代碼稍加改造,啟動多個worker,就可以把任務分布到幾臺甚至幾十臺機器上,比如把計算n*n
的代碼換成發(fā)送郵件,就實現(xiàn)了郵件隊列的異步發(fā)送。
Queue對象存儲在哪?注意到task_worker.py
中根本沒有創(chuàng)建Queue的代碼,所以,Queue對象存儲在task_master.py
進程中:

而Queue
之所以能通過網絡訪問,就是通過QueueManager
實現(xiàn)的。由于QueueManager
管理的不止一個Queue
,所以,要給每個Queue
的網絡調用接口起個名字,比如get_task_queue
。
authkey
有什么用?這是為了保證兩臺機器正常通信,不被其他機器惡意干擾。如果task_worker.py
的authkey
和task_master.py
的authkey
不一致,肯定連接不上。
小結
Python的分布式進程接口簡單,封裝良好,適合需要把繁重任務分布到多臺機器的環(huán)境下。
注意Queue的作用是用來傳遞任務和接收結果,每個任務的描述數據量要盡量小。比如發(fā)送一個處理日志文件的任務,就不要發(fā)送幾百兆的日志文件本身,而是發(fā)送日志文件存放的完整路徑,由Worker進程再去共享的磁盤上讀取文件。