14.1 TCP編程
Socket是網(wǎng)絡(luò)編程的一個(gè)抽象概念。通常我們用一個(gè)Socket表示“打開了一個(gè)網(wǎng)絡(luò)鏈接”,而打開一個(gè)Socket需要知道目標(biāo)計(jì)算機(jī)的IP地址和端口號(hào),再指定協(xié)議類型即可。
客戶端
大多數(shù)連接都是可靠的TCP連接。創(chuàng)建TCP連接時(shí),主動(dòng)發(fā)起連接的叫客戶端,被動(dòng)響應(yīng)連接的叫服務(wù)器。
舉個(gè)例子,當(dāng)我們?cè)跒g覽器中訪問新浪時(shí),我們自己的計(jì)算機(jī)就是客戶端,瀏覽器會(huì)主動(dòng)向新浪的服務(wù)器發(fā)起連接。如果一切順利,新浪的服務(wù)器接受了我們的連接,一個(gè)TCP連接就建立起來的,后面的通信就是發(fā)送網(wǎng)頁(yè)內(nèi)容了。
所以,我們要?jiǎng)?chuàng)建一個(gè)基于TCP連接的Socket,可以這樣做:
創(chuàng)建Socket
時(shí),AF_INET
指定使用IPv4協(xié)議,如果要用更先進(jìn)的IPv6,就指定為AF_INET6
。SOCK_STREAM
指定使用面向流的TCP協(xié)議,這樣,一個(gè)Socket
對(duì)象就創(chuàng)建成功,但是還沒有建立連接。
客戶端要主動(dòng)發(fā)起TCP連接,必須知道服務(wù)器的IP地址和端口號(hào)。新浪網(wǎng)站的IP地址可以用域名www.sina.com.cn
自動(dòng)轉(zhuǎn)換到IP地址,但是怎么知道新浪服務(wù)器的端口號(hào)呢?
答案是作為服務(wù)器,提供什么樣的服務(wù),端口號(hào)就必須固定下來。由于我們想要訪問網(wǎng)頁(yè),因此新浪提供網(wǎng)頁(yè)服務(wù)的服務(wù)器必須把端口號(hào)固定在80
端口,因?yàn)?code>80端口是Web服務(wù)的標(biāo)準(zhǔn)端口。其他服務(wù)都有對(duì)應(yīng)的標(biāo)準(zhǔn)端口號(hào),例如SMTP服務(wù)是25
端口,F(xiàn)TP服務(wù)是21
端口,等等。端口號(hào)小于1024的是Internet標(biāo)準(zhǔn)服務(wù)的端口,端口號(hào)大于1024的,可以任意使用。
因此,我們連接新浪服務(wù)器的代碼如下:
注意參數(shù)是一個(gè)tuple
,包含地址和端口號(hào)。
建立TCP連接后,我們就可以向新浪服務(wù)器發(fā)送請(qǐng)求,要求返回首頁(yè)的內(nèi)容:
TCP連接創(chuàng)建的是雙向通道,雙方都可以同時(shí)給對(duì)方發(fā)數(shù)據(jù)。但是誰先發(fā)誰后發(fā),怎么協(xié)調(diào),要根據(jù)具體的協(xié)議來決定。例如,HTTP協(xié)議規(guī)定客戶端必須先發(fā)請(qǐng)求給服務(wù)器,服務(wù)器收到后才發(fā)數(shù)據(jù)給客戶端。
發(fā)送的文本格式必須符合HTTP標(biāo)準(zhǔn),如果格式?jīng)]問題,接下來就可以接收新浪服務(wù)器返回的數(shù)據(jù)了:
接收數(shù)據(jù)時(shí),調(diào)用recv(max)
方法,一次最多接收指定的字節(jié)數(shù),因此,在一個(gè)while循環(huán)中反復(fù)接收,直到recv()
返回空數(shù)據(jù),表示接收完畢,退出循環(huán)。
當(dāng)我們接收完數(shù)據(jù)后,調(diào)用close()
方法關(guān)閉Socket,這樣,一次完整的網(wǎng)絡(luò)通信就結(jié)束了:
現(xiàn)在,只需要在瀏覽器中打開這個(gè)sina.html
文件,就可以看到新浪的首頁(yè)了。
服務(wù)器
和客戶端編程相比,服務(wù)器編程就要復(fù)雜一些。
服務(wù)器進(jìn)程首先要綁定一個(gè)端口并監(jiān)聽來自其他客戶端的連接。如果某個(gè)客戶端連接過來了,服務(wù)器就與該客戶端建立Socket連接,隨后的通信就靠這個(gè)Socket連接了。
所以,服務(wù)器會(huì)打開固定端口(比如80)監(jiān)聽,每來一個(gè)客戶端連接,就創(chuàng)建該Socket連接。由于服務(wù)器會(huì)有大量來自客戶端的連接,所以,服務(wù)器要能夠區(qū)分一個(gè)Socket連接是和哪個(gè)客戶端綁定的。一個(gè)Socket依賴4項(xiàng):服務(wù)器地址、服務(wù)器端口、客戶端地址、客戶端端口來唯一確定一個(gè)Socket。
但是服務(wù)器還需要同時(shí)響應(yīng)多個(gè)客戶端的請(qǐng)求,所以,每個(gè)連接都需要一個(gè)新的進(jìn)程或者新的線程來處理,否則,服務(wù)器一次就只能服務(wù)一個(gè)客戶端了。
我們來編寫一個(gè)簡(jiǎn)單的服務(wù)器程序,它接收客戶端連接,把客戶端發(fā)過來的字符串加上Hello
再發(fā)回去。
首先,創(chuàng)建一個(gè)基于IPv4和TCP協(xié)議的Socket:
然后,我們要綁定監(jiān)聽的地址和端口。服務(wù)器可能有多塊網(wǎng)卡,可以綁定到某一塊網(wǎng)卡的IP地址上,也可以用0.0.0.0
綁定到所有的網(wǎng)絡(luò)地址,還可以用127.0.0.1
綁定到本機(jī)地址。127.0.0.1
是一個(gè)特殊的IP地址,表示本機(jī)地址,如果綁定到這個(gè)地址,客戶端必須同時(shí)在本機(jī)運(yùn)行才能連接,也就是說,外部的計(jì)算機(jī)無法連接進(jìn)來。
端口號(hào)需要預(yù)先指定。因?yàn)槲覀儗懙倪@個(gè)服務(wù)不是標(biāo)準(zhǔn)服務(wù),所以用9999
這個(gè)端口號(hào)。請(qǐng)注意,小于1024
的端口號(hào)必須要有管理員權(quán)限才能綁定:
緊接著,調(diào)用listen()
方法開始監(jiān)聽端口,傳入的參數(shù)指定等待連接的最大數(shù)量:
接下來,服務(wù)器程序通過一個(gè)永久循環(huán)來接受來自客戶端的連接,accept()
會(huì)等待并返回一個(gè)客戶端的連接:
每個(gè)連接都必須創(chuàng)建新線程(或進(jìn)程)來處理,否則,單線程在處理連接的過程中,無法接受其他客戶端的連接:
連接建立后,服務(wù)器首先發(fā)一條歡迎消息,然后等待客戶端數(shù)據(jù),并加上Hello
再發(fā)送給客戶端。如果客戶端發(fā)送了exit
字符串,就直接關(guān)閉連接。
要測(cè)試這個(gè)服務(wù)器程序,我們還需要編寫一個(gè)客戶端程序:
我們需要打開兩個(gè)命令行窗口,一個(gè)運(yùn)行服務(wù)器程序,另一個(gè)運(yùn)行客戶端程序,就可以看到效果了:

需要注意的是,客戶端程序運(yùn)行完畢就退出了,而服務(wù)器程序會(huì)永遠(yuǎn)運(yùn)行下去,必須按Ctrl+C退出程序。
小結(jié)
用TCP協(xié)議進(jìn)行Socket編程在Python中十分簡(jiǎn)單,對(duì)于客戶端,要主動(dòng)連接服務(wù)器的IP和指定端口,對(duì)于服務(wù)器,要首先監(jiān)聽指定端口,然后,對(duì)每一個(gè)新的連接,創(chuàng)建一個(gè)線程或進(jìn)程來處理。通常,服務(wù)器程序會(huì)無限運(yùn)行下去。
同一個(gè)端口,被一個(gè)Socket綁定了以后,就不能被別的Socket綁定了。