隨著5G、云計算、AI等技術(shù)的不斷演進,SDN與NFV或者其他虛擬化網(wǎng)絡技術(shù)在數(shù)據(jù)中心進行應用。數(shù)據(jù)中心經(jīng)歷了從經(jīng)典三層架構(gòu)、大二層網(wǎng)絡架構(gòu)、再到Spine/Leaf的葉脊架構(gòu),數(shù)據(jù)中心網(wǎng)絡架構(gòu)的發(fā)展越來越扁平化與自動化。
另外,數(shù)據(jù)中心有簡化的趨勢,數(shù)據(jù)中心網(wǎng)絡新設計正在從2層轉(zhuǎn)向3層。當前最先進的數(shù)據(jù)中心只是運行BGP、EVPN和BFD協(xié)議來進行快速的故障轉(zhuǎn)移。
數(shù)據(jù)中心越先進,運行的協(xié)議就越少,配置文件就越短。然而,這種簡化趨勢主要是需要更多的可見性,因為聰明的人想要看到他們的網(wǎng)絡內(nèi)部發(fā)生了什么。隨著網(wǎng)絡變得越來越大、越來越快,精明的IT管理人員正在使用更少的協(xié)議,但目標是更多的遙測和監(jiān)控技術(shù),以實現(xiàn)更好的可見性。
面對數(shù)據(jù)中心的網(wǎng)絡結(jié)構(gòu)的發(fā)展變化,納多德在已有大量項目方案的實際經(jīng)驗基礎上,介紹五種新方法,來幫助用戶優(yōu)化企業(yè)的數(shù)據(jù)中心網(wǎng)絡架構(gòu):
用VXLAN替換VLAN
使用ARP抑制來減少廣播流
用EVPN Multihoming替換MLAG
使用ECMP和UCMP 處理流量平衡
利用自適應路由解決流量極化問題
1.用VXLAN替換VLAN
VXLAN(Virtual eXtensible Local Area Network,虛擬擴展局域網(wǎng))是由IETF定義的NVO3(Network Virtualization over Layer 3)標準技術(shù)之一,采用L2 over L4(MAC-in-UDP)的報文封裝模式,將二層報文用三層協(xié)議進行封裝,可實現(xiàn)二層網(wǎng)絡在三層范圍內(nèi)進行擴展,同時滿足數(shù)據(jù)中心大二層虛擬遷移和多租戶的需求。
傳統(tǒng)2層網(wǎng)絡具有以下缺點:
它依賴生成樹協(xié)議(STP),導致帶寬利用率、冗余和多路徑的能力受到生成樹功能的限制。
它只能在一個子網(wǎng)內(nèi)運行,當使用MLAG時 ,冗余通常僅限于兩個設備。
任何路徑級冗余都需要鏈路聚合控制協(xié)議(LACP),這是端口的標準冗余技術(shù)。
如上圖所示,VXLAN克服了傳統(tǒng)2層網(wǎng)絡的缺陷,允許網(wǎng)絡管理者在3層路由結(jié)構(gòu)上進行優(yōu)化。用戶仍然可以實現(xiàn)2層網(wǎng)絡的覆蓋,但由于使用EVPN作為控制平面,因此不再需要生成樹來進行控制平面收斂。EVPN通過BGP地址簇來交換MAC信息,而不是低效的廣播泛洪和學習。此外,VXLAN使用24位ID ,可定義多達1600萬個虛擬網(wǎng)絡,而VLAN只有12位ID,僅限于4094個虛擬網(wǎng)絡。總之,VXLAN通過MAC-in-UDP的報文封裝,實現(xiàn)了二層報文在三層網(wǎng)絡上的透傳,在云端上架起了一道道無形的“彩虹”,解決了云計算中虛擬化帶來的一系列問題。
2. 使用ARP抑制來減少廣播傳播
在部署VXLAN的數(shù)據(jù)中心中BUM報文可以通過ARP抑制進一步優(yōu)化。通常是在EVPN中使用頭端復制的方式(具體體現(xiàn)是在橋中添加mac地址為全0的FDB表項進行頭端復制)來進行實現(xiàn)。當有很多的ARP廣播請求報文的時候,容易造成廣播泛濫。采用ARP抑制可以有效限制廣播ARP報文的數(shù)量。
如上圖所示,VXLAN三層網(wǎng)關通過動態(tài)學習終端租戶的ARP表項,再根據(jù)ARP表項生成主機信息(包括主機IP地址、 MAC地址、 VTEP地址和VNI ID),并將主機信息通過MP-BGP或BGP EVPN對外發(fā)布,使其他的BGP鄰居可以學習到主機信息。因此部署ARP抑制可以優(yōu)化覆蓋網(wǎng)絡控制平面的,獲得更快的地址解析速度。它還減少了網(wǎng)絡中的廣播流量,因為ARP抑制減少了向VXLAN基礎設施中的每個VTEP發(fā)送ARP請求的需要。
3. 用 EVPN Multihoming(EVPN-MH(EVPN多宿主))替換MLAG
在某些場景中,VXLAN環(huán)境中仍然需要MLAG來實現(xiàn)冗余多宿主機的連接。EVPN-MH是一個擺脫現(xiàn)有專用MLAG解決方案的機會,它提供雙活服務器冗余支持,因為專用MLAG解決方案的擴展范圍不超過一個設備冗余級別。
EVPNMultihoming特點
無需在TOR交換機之間建立Peerlink鏈路或交換機間鏈路
允許兩個以上TOR交換機成為一個冗余組
提供單個BGP-EVPN 控制平面
允許多供應商互操作性
如上圖所示,VXLAN有助于消除MLAG所需的背靠LEAF到SPINE交換機連接的需要。EVPN-MH進一步消除了Server到TOR交換機連接中對MLAG的任何需要。
Multihoming 使用EVPN消息與宿主機進行通信,并使用主機連接信息動態(tài)構(gòu)建與服務器的2層鄰接關系。當MLAG需要LAG ID時,Multihoming使用以太網(wǎng)段ID。接口映射到用于作為與同一終端主機邏輯連接的以太網(wǎng)段(Ethernet Segment)。
此外,通過在交換機中使用標準協(xié)議構(gòu)造冗余,轉(zhuǎn)向使用EVPN-MH可以提高網(wǎng)絡供應商的互操作性。由于EVPN底層使用開放標準協(xié)議BGP ,任何通過RFC規(guī)范實現(xiàn)EVPN-MH的供應商都可以成為以太網(wǎng)段的一部分。
4. ECMP和UCMP處理流量平衡
ECMP(等價多路徑路由)即存在多條到達同一個目的地址的相等開銷的路徑。它是大多數(shù)3層路由協(xié)議中的標準功能,在這些協(xié)議中,在所有可用的下一跳上行鏈路中實現(xiàn)平衡的等價路由。2層控制平面技術(shù)(如:生成樹)僅允許通過依賴外部技術(shù)(如:LACP)實現(xiàn)同等價負載分擔。
ECMP是3層路由中的原生功能,它使您能夠提高網(wǎng)絡設備的效率。
在某些情況下,ECMP可能會導致轉(zhuǎn)發(fā)效率低下,特別是在部署全面的3層解決方案時,在網(wǎng)絡中的任何位置都使用點對點L3鏈路,甚至到主機。在這種情況下,您可能希望在使用鏈路數(shù)量以外的指標來平衡流量。UCMP(非平衡鏈路負載均衡)在這里很有用,因為它使用BGP標記創(chuàng)建跨躍點的流量分布,以便更好地與應用程序分布相匹配。UCMP區(qū)別于傳統(tǒng)ECMP,其最大特點是利用權(quán)重值來區(qū)別對待帶寬的使用,使得兩條不同帶寬的出口,可根據(jù)帶寬大小不同來承擔不同的數(shù)據(jù)流量傳輸.
5. 通過自適應路由解決流量極化問題
自適應路由是現(xiàn)有InfiniBand技術(shù)在以太網(wǎng)交換上的實現(xiàn)。自適應路由監(jiān)控鏈路帶寬、鏈路利用率、交換機緩沖區(qū)和ECN/PFC ,將轉(zhuǎn)發(fā)到ECMP組的流量選擇擁塞程度最低的端口進行傳輸,擁塞程度基于出口隊列負載進行評估,確保 ECMP組在不考慮“熵”級別的情況下保持良好平衡。
“熵”是一種衡量流經(jīng)既定網(wǎng)絡的流量的豐富性和多樣性的方法。
例如:當您有數(shù)千個從全球各地的客戶端隨機連接的流時,您的網(wǎng)絡被稱為有high entropy(高熵)。然而,當您只有少數(shù)大型流時(這在 AI 和存儲工作負載中經(jīng)常發(fā)生),大型流會控制帶寬,因此會出現(xiàn) low entropy(低熵)。這種低熵流量模式也稱為“大象流”分布,在許多數(shù)據(jù)中心工作負載中都很明顯。
當使用靜態(tài) ECMP 的傳統(tǒng)技術(shù),您需要“高熵”來將流量均勻地分布在多個鏈路上,而不會出現(xiàn)擁塞。然而,在“大象流”場景中,多個流可能出現(xiàn)在同一條鏈路上,從而創(chuàng)建一個超過線路帶寬的流量熱點或微突發(fā)。這會導致?lián)砣?、延遲增加、數(shù)據(jù)包丟失和重傳。對于許多應用程序,性能不僅取決于網(wǎng)絡的平均帶寬,還取決于流完成時間的分布。完成時間分布中的長尾或異常值可能會顯著降低應用程序性能。
因此,通過自適應路由技術(shù)利用其靈活的網(wǎng)絡拓撲適應性,對于 CLOS(或葉/脊椎)等典型拓撲,到既定目標的各種路徑間距相同時,交換機通常擁塞最小的端口傳輸數(shù)據(jù)包。當在路徑間距不同的其他拓撲中,交換機傾向于通過最短路徑發(fā)送流量。如果擁塞發(fā)生在最短路徑上,則選擇擁塞最小的備選路徑。這確保了網(wǎng)絡帶寬得到有效利用。自適應路由的目標是將網(wǎng)絡管理員從手動調(diào)整干預中解放出來,讓基礎網(wǎng)絡處理聚合流負載均衡的優(yōu)化工作。
以上我們介紹了數(shù)據(jù)中心網(wǎng)絡中可用的優(yōu)化方案。這些優(yōu)化有助于減少基礎設施上不必要的控制流量,并且可平衡現(xiàn)有物理鏈路上的流量,充分利用所有可用鏈路帶寬。
納多德NADDOD利用自有光連接件與NVIDIA的網(wǎng)絡硬軟件產(chǎn)品資源和技術(shù)優(yōu)勢,可為客戶提供更豐富、更靈活、更優(yōu)質(zhì)的產(chǎn)品技術(shù)解決方案,為用戶業(yè)務賦能。納多德NADDOD光網(wǎng)絡整體解決方案如下圖所示:
面對數(shù)據(jù)中心的網(wǎng)絡結(jié)構(gòu)的發(fā)展變化,納多德NADDOD作為NVIDIA網(wǎng)絡產(chǎn)品Elite Partner,實現(xiàn)光連接+NVIDIA 網(wǎng)絡產(chǎn)品與解決方案強強聯(lián)合,充分發(fā)揮雙方產(chǎn)品技術(shù)、市場覆蓋與生態(tài)優(yōu)勢,在技術(shù)領先競爭力與產(chǎn)品整體方案豐富度上優(yōu)勢互補,為數(shù)據(jù)中心、高性能計算、邊緣計算、人工智能等應用場景提供更具優(yōu)勢與價值的光連接產(chǎn)品和整體解決方案,大幅提高客戶業(yè)務加速能力。
審核編輯:湯梓紅
-
數(shù)據(jù)中心
+關注
關注
16文章
4631瀏覽量
71888 -
網(wǎng)絡結(jié)構(gòu)
關注
0文章
48瀏覽量
11059 -
5G
+關注
關注
1352文章
48327瀏覽量
562961
發(fā)布評論請先 登錄
相關推薦
評論