云計算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,對承載數(shù)據(jù)流量的數(shù)據(jù)中心網(wǎng)絡(luò)提出了更高的要求,高吞吐量、高可靠性、低時延、適應服務(wù)器虛擬化等都是業(yè)務(wù)對數(shù)據(jù)中心網(wǎng)絡(luò)提出的要求。為了滿足業(yè)務(wù)對網(wǎng)絡(luò)的要求,越來越多的企業(yè)選擇構(gòu)建自己的數(shù)據(jù)中心或者租用公用云來承載日益增長的業(yè)務(wù)流量。
服務(wù)器虛擬化技術(shù)在數(shù)據(jù)中心解決方案中得到廣泛應用,但服務(wù)器在遷移時,為了保證遷移時業(yè)務(wù)不中斷,就要求不僅虛擬機的IP地址不變,而且虛擬機的運行狀態(tài)也必須保持原狀(例如TCP會話狀態(tài)),所以虛擬機的動態(tài)遷移只能在同一個二層域中進行,而不能跨二層域遷移,這也就要數(shù)據(jù)中心內(nèi)的二層網(wǎng)絡(luò)足夠大。
受制于VLAN和STP這兩項傳統(tǒng)二層網(wǎng)絡(luò)關(guān)鍵技術(shù)的特點制約,傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)無法滿足網(wǎng)絡(luò)匯聚層面水平拓展,且鏈路冗余性的實現(xiàn)代價是降低鏈路效率(運行STP協(xié)議會阻塞冗余鏈路中的一條),廣播域大小和數(shù)量限制主機與租戶數(shù)量,網(wǎng)絡(luò)收斂比及網(wǎng)絡(luò)資源利用率等指標對于目前數(shù)據(jù)中心標準來說,也是遠遠不夠的。
方正推出的數(shù)據(jù)中心網(wǎng)絡(luò)解決方案就是為了解決以上痛點而產(chǎn)生的。
隨著云計算的發(fā)展,橫向(East-West)流量在數(shù)據(jù)中心中占據(jù)主導地位,涵蓋幾乎所有的云計算,虛擬化以及大數(shù)據(jù)。橫向網(wǎng)絡(luò)在縱向設(shè)計的網(wǎng)絡(luò)拓撲中傳輸數(shù)據(jù)會帶有傳輸?shù)钠款i,因為數(shù)據(jù)經(jīng)過了許多不必要的節(jié)點(如路由和交換機等設(shè)備)。主機互訪需要通過層層的上行口,帶來明顯的性能衰減,而三層網(wǎng)絡(luò)的原始設(shè)計更會加劇這種性能衰減,這也就是為什么當前主流的三層網(wǎng)絡(luò)拓撲結(jié)構(gòu)越來越不能滿足數(shù)據(jù)中心網(wǎng)絡(luò)需求的原因。
目前建議的數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)一般采用“兩層”結(jié)構(gòu)。這里的“二層”是指Spine+Leaf兩層設(shè)備的扁平化設(shè)計,二層架構(gòu)比多層架構(gòu)整體上具有更小的收斂比,在性能要求更高的數(shù)據(jù)中心等環(huán)境應考慮為二層扁平化架構(gòu)設(shè)計。
在這種組網(wǎng)方式中,任何兩臺服務(wù)器間的通信不超過3臺設(shè)備,每個Spine和Leaf節(jié)點全互連,可以方便地通過擴展Spine節(jié)點來實現(xiàn)網(wǎng)絡(luò)規(guī)模的彈性擴展。只要遍歷一定數(shù)量的交換機,可以在幾乎所有數(shù)據(jù)中心結(jié)構(gòu)體系中的服務(wù)器節(jié)點之間傳輸流量,該架構(gòu)由多條高帶寬的直接路徑組成,消除了網(wǎng)絡(luò)瓶頸帶來的潛在傳輸速度下降,從而實現(xiàn)極高的轉(zhuǎn)發(fā)效率和低延遲。
此外,針對前面提到的服務(wù)器虛擬機數(shù)量的快速增長與虛擬機遷移這一常態(tài)性業(yè)務(wù),傳統(tǒng)的數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)中VLAN隔離技術(shù)已無法支撐該業(yè)務(wù)特性。因此推薦部署Overlay網(wǎng)絡(luò)。
Overlay網(wǎng)絡(luò)是建立在已有物理網(wǎng)絡(luò)上的虛擬網(wǎng)絡(luò),具有獨立的控制和轉(zhuǎn)發(fā)平面,對于連接到Overlay的終端設(shè)備(例如服務(wù)器)來說,物理網(wǎng)絡(luò)是透明的,從而可以實現(xiàn)承載網(wǎng)絡(luò)和業(yè)務(wù)網(wǎng)絡(luò)的分離。
VXLAN是目前獲得廣泛支持的Overlay技術(shù),是由IETF定義的NVO3(Network Virtualization over Layer 3)標準技術(shù)之一,采用MAC-in-UDP的報文封裝模式,原始報文在VXLAN接入點(被稱為VTEP)加上VXLAN幀頭后再被封裝在UDP報頭中,并使用承載網(wǎng)絡(luò)的IP/MAC地址作為外層頭進行封裝,承載網(wǎng)絡(luò)只需要按照普通的二三層轉(zhuǎn)發(fā)流程進行轉(zhuǎn)發(fā)即可。
VTEP(VXLAN Tunnel Endpoints,VXLAN隧道端點)
VXLAN網(wǎng)絡(luò)的邊緣設(shè)備,是VXLAN隧道的起點和終點,進行VXLAN報文的封裝、解封裝等處理。VTEP既可以部署在網(wǎng)絡(luò)設(shè)備上(網(wǎng)絡(luò)接入交換機),也可以部署在vSwitch上(服務(wù)器上的虛擬交換機)。
VNI(VXLAN Network Identifier,VXLAN 網(wǎng)絡(luò)標識符)
VNI是一種類似于VLAN ID的網(wǎng)絡(luò)標識,用來標識VXLAN二層網(wǎng)絡(luò)。一個VNI代表一個VXLAN段,不同VXLAN段的虛擬機不能直接二層相互通信。
VXLAN隧道
兩個VTEP之間建立的邏輯隧道,用于傳輸VXLAN報文。業(yè)務(wù)報文在進入VXLAN隧道式進行VXLAN、UDP、IP頭封裝,然后通過三層轉(zhuǎn)發(fā)透明地將報文轉(zhuǎn)發(fā)給遠端VTEP,遠端VTEP對報文進行解封裝處理。
VXLAN不僅可以支持單數(shù)據(jù)中心內(nèi)數(shù)通需求,還可以實現(xiàn)多數(shù)據(jù)中心之間大二層環(huán)境的搭建。
通過BGP EVPN在兩個數(shù)據(jù)中心內(nèi)部各建立一段VXLAN隧道,數(shù)據(jù)中心之間再建立一段VXLAN隧道,可以實現(xiàn)數(shù)據(jù)中心互聯(lián)。如圖,分別在數(shù)據(jù)中心A、數(shù)據(jù)中心B內(nèi)配置BGP EVPN協(xié)議創(chuàng)建分布式網(wǎng)關(guān)VXLAN隧道,實現(xiàn)各數(shù)據(jù)中心內(nèi)部VM之間的通信。Leaf2和Leaf3是數(shù)據(jù)中心內(nèi)連接骨干網(wǎng)的邊緣設(shè)備,通過在Leaf2和Leaf3上配置BGP EVPN協(xié)議創(chuàng)建VXLAN隧道,將從一側(cè)數(shù)據(jù)中心收到的VXLAN報文先解封裝、然后再重新封裝后發(fā)送到另一側(cè)數(shù)據(jù)中心,實現(xiàn)對跨數(shù)據(jù)中心的報文端到端的VXLAN報文承載,保證跨數(shù)據(jù)中心VM之間的通信。