解析華為Datacom認(rèn)證:從MPLS-SR的演進(jìn)之路
華為Datacom認(rèn)證已于4月18日正式發(fā)布,大家都知道,全新的Datacom認(rèn)證在傳統(tǒng)路由交換技術(shù)基礎(chǔ)之上,融合了華為數(shù)通網(wǎng)絡(luò)解決方案、網(wǎng)絡(luò)新技術(shù)。下面我們就通過一篇文章,來看Datacom認(rèn)證中的新知識(shí)點(diǎn),從MPLS到SR的演進(jìn)。
在“云網(wǎng)一體化”的背景下,骨干網(wǎng)以及數(shù)據(jù)中心網(wǎng)絡(luò)等場(chǎng)景要求網(wǎng)絡(luò)更加靈活、可靠、智能。數(shù)據(jù)中心組網(wǎng)從“兩地三中心”到“分布式多活”的架構(gòu),需要對(duì)各類業(yè)務(wù)流量進(jìn)行實(shí)時(shí)的調(diào)度、優(yōu)化,而傳統(tǒng)IP轉(zhuǎn)發(fā)存在諸多缺陷,不能滿足上述需求。MPLS技術(shù)的出現(xiàn)一定程度上解決了IP轉(zhuǎn)發(fā)的缺陷,但是在實(shí)現(xiàn)流量工程等方面仍然顯得“力不從心”,而SR技術(shù)的橫空出世可以說是迎合SDN時(shí)代的革新。

通過上圖,我們可以發(fā)現(xiàn)當(dāng)一個(gè)數(shù)據(jù)包到達(dá)路由器的時(shí)候,路由器根據(jù)目的地址查詢IP路由表進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā),這種轉(zhuǎn)發(fā)方式需要每臺(tái)路由器通過最長(zhǎng)掩碼匹配原則進(jìn)行逐跳轉(zhuǎn)發(fā)。早期路由器硬件性能有限,導(dǎo)致這種查表方式的轉(zhuǎn)發(fā)效率相對(duì)低下;而現(xiàn)在的路由器因?yàn)閷S眯酒ˋSIC、NP)可以實(shí)現(xiàn)硬件轉(zhuǎn)發(fā),轉(zhuǎn)發(fā)效率得到大幅提升。但是IP路由轉(zhuǎn)發(fā)采用無連接的轉(zhuǎn)發(fā)方式卻帶來了新的問題:
1、配置BGP等協(xié)議跨設(shè)備傳遞路由,可能出現(xiàn)路由黑洞;2、無法提供較好的端到端QoS保證或者靈活的流量工程。
何為路由黑洞?
多數(shù)據(jù)中心、企業(yè)分支互聯(lián)等大規(guī)模組網(wǎng)場(chǎng)景,BGP邊界網(wǎng)關(guān)協(xié)議必不可少,而傳統(tǒng)IP轉(zhuǎn)發(fā)的方式會(huì)導(dǎo)致BGP路由黑洞,如下圖場(chǎng)景。

路由傳遞過程:AS100中的設(shè)備R1將Net1的路由借助BGP(路由搬運(yùn)工)傳遞給R2,R2繼續(xù)借助BGP “隔空傳物”將路由直接傳遞給R4,最終R4傳遞給AS300中的R5。
數(shù)據(jù)轉(zhuǎn)發(fā)過程:AS300中存在業(yè)務(wù)需要訪問Net1,于是R5將數(shù)據(jù)報(bào)文發(fā)送給R4,R4需要將數(shù)據(jù)報(bào)文發(fā)給R2,但是真實(shí)轉(zhuǎn)發(fā)路徑需要發(fā)送給R3,還記得上文提到的IP路由轉(zhuǎn)發(fā)方式嗎?R3因?yàn)闆]有Net1對(duì)應(yīng)的路由,直接丟棄報(bào)文,路由黑洞就產(chǎn)生了。
MPLS多協(xié)議標(biāo)簽交換如何解決上述問題?
下圖說明了典型的MPLS網(wǎng)絡(luò)組網(wǎng)架構(gòu)和數(shù)據(jù)轉(zhuǎn)發(fā)方式:

首先Ingress入口設(shè)備RTA上存在去往4.4.4.4的LSP隧道,則在原始數(shù)據(jù)包中PUSH壓入1027標(biāo)簽(標(biāo)簽位于二層和三層頭部之間),進(jìn)入到對(duì)應(yīng)的LSP隧道;
然后RTB、RTC作為Transit傳輸節(jié)點(diǎn)直接執(zhí)行相應(yīng)的SWAP交換動(dòng)作進(jìn)行標(biāo)簽轉(zhuǎn)發(fā);
最后RTD作為Egress出口設(shè)備執(zhí)行標(biāo)簽POP彈出動(dòng)作,繼而查詢IP路由表進(jìn)行正確的數(shù)據(jù)轉(zhuǎn)發(fā)。
假設(shè)上述路由黑洞場(chǎng)景中,R4上存在去往R2的LSP隧道,直接為數(shù)據(jù)報(bào)文封裝相應(yīng)的標(biāo)簽,而沿途設(shè)備直接通過MPLS標(biāo)簽轉(zhuǎn)發(fā),不再查詢IP路由表,問題是不是就迎刃而解啦?

MPLS真香,Segment Routing又是啥?
如果部署MPLS,我們需要傳統(tǒng)的IGP內(nèi)部網(wǎng)關(guān)協(xié)議實(shí)現(xiàn)路由可達(dá),再通過LDP標(biāo)簽協(xié)議進(jìn)行標(biāo)簽的分配和通告,這無疑增加了控制層面部署的復(fù)雜性,而且IGP和LDP這哥倆哪一個(gè)發(fā)脾氣,都很折騰人。
所以Segment Routing簡(jiǎn)稱SR技術(shù)直接對(duì)現(xiàn)有IGP進(jìn)行擴(kuò)展,使得IS-IS、OSPF等協(xié)議也具備了標(biāo)簽分發(fā)能力,從而簡(jiǎn)化控制層面,凡事IGP說了算,也就不擔(dān)心LDP鬧情緒了。
下圖的數(shù)據(jù)報(bào)文內(nèi)容,展示了IS-IS協(xié)議如何通過特殊TLV來支持標(biāo)簽分發(fā):

SR技術(shù)的數(shù)據(jù)層面仍然可以使用MPLS進(jìn)行標(biāo)簽交換,只不過這里的標(biāo)簽我們更多的稱之為Segment-ID。SR仍然利用IGP計(jì)算最短路徑,通過IGP分配并通告每臺(tái)設(shè)備的前綴或者節(jié)點(diǎn)SID,最后網(wǎng)絡(luò)設(shè)備根據(jù)前綴或節(jié)點(diǎn)SID將數(shù)據(jù)報(bào)文轉(zhuǎn)發(fā)到正確的設(shè)備,如下圖R1根據(jù)節(jié)點(diǎn)SID和前綴SID將數(shù)據(jù)按照最短路徑轉(zhuǎn)發(fā)給R4,這種轉(zhuǎn)發(fā)方式我們也稱為SR-BE(Best-Effort)。

如何利用SR技術(shù)來實(shí)現(xiàn)流量工程?
上面提到無連接的IP轉(zhuǎn)發(fā)方式無法靈活的實(shí)現(xiàn)TE (Traffic Engineering)流量工程,而通過MPLS技術(shù)可以更好的部署流量工程。我們可以通過建立基于一定約束條件(帶寬、路徑)的LSP隧道,實(shí)現(xiàn)流量的引導(dǎo)、帶寬預(yù)留,從而達(dá)到流量工程的目的。
傳統(tǒng)的MPLS TE技術(shù)采用RSVP資源預(yù)留協(xié)議,但如果采用RSVP-TE部署,流量工程會(huì)帶來新的問題:
1、引入控制層面的RSVP-TE協(xié)議,增加部署和維護(hù)的復(fù)雜度;
2、RSVP-TE需要針對(duì)不同業(yè)務(wù)創(chuàng)建多條LSP ,配置量較大;
3、所有網(wǎng)絡(luò)設(shè)備都需要維護(hù)隧道狀態(tài)和轉(zhuǎn)發(fā)表項(xiàng),擴(kuò)展性較差。

設(shè)想如圖所示多個(gè)數(shù)據(jù)中心之間的業(yè)務(wù)需要進(jìn)行流量轉(zhuǎn)發(fā)的顯式路徑規(guī)劃,我們得在沿途所有設(shè)備配置大量的命令,“我太難了”……
而SR技術(shù)作為源路由技術(shù),可以方便我們更好的通過Segment-list(也就是MPLS標(biāo)簽棧)實(shí)現(xiàn)流量引導(dǎo)。
剛才我們提到在SR技術(shù)中,標(biāo)簽也稱之為Segment-ID(SID),這個(gè)SID又分為如下幾種:
1、前綴SID:標(biāo)識(shí)某個(gè)目的地址前綴;
2、節(jié)點(diǎn)SID:特殊的前綴SID,通常是環(huán)回接口的/32 IP地址,標(biāo)識(shí)某臺(tái)設(shè)備;
3、鄰接SID:標(biāo)識(shí)設(shè)備的鄰接關(guān)系,也就是接口或鏈路。

而通過在源端設(shè)備上壓入相應(yīng)的Segment-list(標(biāo)簽棧),我們可實(shí)現(xiàn)流量通過特定的路徑、特定的設(shè)備進(jìn)行轉(zhuǎn)發(fā)。正如上圖我們看到的,數(shù)據(jù)轉(zhuǎn)發(fā)的過程解析如下:
1、R1為數(shù)據(jù)包壓入了標(biāo)簽棧;
2、R1通過查詢棧頂標(biāo)簽(節(jié)點(diǎn)SID:101)將報(bào)文發(fā)送給相應(yīng)的節(jié)點(diǎn)R3;
3、R3發(fā)現(xiàn)棧頂標(biāo)簽為自身節(jié)點(diǎn)SID則彈出標(biāo)簽,繼續(xù)查詢并彈出相應(yīng)標(biāo)簽(鄰接SID:1034)將報(bào)文發(fā)送給R4;
4、R4、R5則根據(jù)標(biāo)簽(前綴SID:100)將數(shù)據(jù)轉(zhuǎn)發(fā)至R6。
SR-TE的隧道轉(zhuǎn)發(fā)路徑,可以通過源端設(shè)備的標(biāo)簽棧來引導(dǎo) ,更加靈活、智能,而且工作量大大降低