最近產業(yè)中最愛玩的一個游戲,就是“AI在哪”。以往我們能看到AI存在于實驗室內、存在于軟件之中,但想要讓AI從模型走進現實,往往沒那么容易。最起碼的,AI任務需要一系列條件去支撐,其細節(jié)建立在各種ICT基礎設施的迭代之上。或許可以這樣比喻,AI就像汽車,當它到來時,配套的高速路加油站修車廠都要建好。馬車時代的路況,是無法發(fā)揮汽車任何優(yōu)勢的。
AI走到現實的重要條件有很多,尤其需要注意的是,AI必然建立在ICT基礎設施之上,通過網絡空間延展到萬物智能應用當中。可以說,AI的運轉與網絡環(huán)境息息相關,網絡是AI的行軍之路。然而在AI的兵馬到來之際,網絡環(huán)境這條運兵棧道真的已經修建好了嗎?如果我們分析一下今天AI面臨的“網絡路況”,會發(fā)現其中孕育著很多痛點。同時,一個智能時代的產業(yè)機遇也蘊藏其中。
AI時代的前夜,網絡表示“壓力山大”
我們相信AI時代會在明晨到來,那么今天就是AI時代的前夜。
這個漫長的前夜里,AI應用正在為ICT基礎設施提出越來越多的挑戰(zhàn)。
首先AI運算相比以往的運算更加復雜,一次智能化識別的背后可能包含著幾百個模型的計算。能夠承擔更復雜的運算任務,顯然是AI應用ICT基礎設施的第一要務。
同時AI運算往往關乎于圖像、關乎于視頻,其數據量的龐大程度相比以往實現了從線性到張量的躍進。能承擔更大的數據通過量才能讓AI應用平穩(wěn)運行。
最后AI運算對于ICT基礎設施的部署條件要求也更加嚴苛,以往以太網1‰的丟包率,對于AI應用來說會極大的影響其算力發(fā)揮。
這些AI給計算和通信帶來的改變,同時也給通行的網絡環(huán)境施加了巨大的負擔。無論是智能駕駛這樣的巨大數據量任務,還是工業(yè)互聯網精準的算法模型部署要求,或者AIoT駁雜的運維壓力,都給網絡環(huán)境添加了無數壓力。
面對AI的到來,網絡環(huán)境的痛點可以體現在這樣幾個方面:
1、龐大算力需要和復雜的異構計算,需要彈性的網絡環(huán)境支撐,網絡速度跟不上,AI算力也就無的放矢。
2、AI任務要求大規(guī)模部署和并行計算、海量非結構化數據通過、實時學習、算法在框架層和應用層的精準度一致等等。這些新要求是此前的網絡環(huán)境中所不具備的,需要新的主動網絡優(yōu)化能力。
3、AI時代,企業(yè)業(yè)務空間增長,并行數據量暴增,直接導致運維工作太過復雜,解放這一壓力,也已經刻不容緩。
這三大痛點之下,直接的結果是網絡交換機市場迎來了全新的挑戰(zhàn),同時也是市場迭代的深刻機遇。具有AI支撐能力、智能運維能力的次世代網絡交換機,成為了今天AI大局中的當務之急。
引入CloudEngine 16800作為華為AI發(fā)展戰(zhàn)略以及全棧全場景AI解決方案中的新成員,通過創(chuàng)造性地在交換機中安裝AI芯片,通過智能優(yōu)化和本地決策獲取自動駕駛網絡能力。加上單槽48 x 400GE高密端口,可以最大化支持AI運算的高密度流量,把網絡環(huán)境建設推向了AI時代的新層次。
CloudEngine 16800背后,華為解決了AI前夜的兩個重要問題:讓現在簡單,讓未來通順。
更簡單的今天:用AI之力扭轉網絡運維困境
分析通過安裝AI芯片,CloudEngine 16800首創(chuàng)在交換機當中添加AI算力,在設備層面集成了智能化的主動識別和實施決策能力。在這種能力之下,可以實現秒級故障識別和分鐘級故障自動定位。
而這一功能為應用者帶來的第一個改變,就在于將可以用AI的智慧來完成運維工作,將今天與日俱增的運維壓力釋放出來。
用AI來承擔原本耗費大量人力,并且逐漸已經無法為人類所完成的網絡運維工作,可以看作幾個梯段達成的目標。
在CloudEngine 16800的AI引擎解決方案中,首先完成的是智能診斷的本地化,通過CloudEngine 16800的本地推理和實時決策,用AI承擔運維工作,減少對云服務診斷的依賴,實現低成本高效率。
接下來,基于智能化運維和故障檢測,以及專業(yè)故障庫的智能匹配,達成故障主動排查,主動監(jiān)控的能力。將人工難以完成的復雜網絡運維監(jiān)控承擔下來。
此外,通過智能運維平臺和交換機本地智能構成的分布式AI運維架構的配合,實現故障快速自我修復,完成從本地分析到自我愈合的完整AI網絡運維體系。整個網絡系統(tǒng)開始接近“自動駕駛”狀態(tài),將用戶從不斷復雜的網絡運維中解放出來,從而更加關注場景和應用,而不是消耗大量人力物力在后勤保障上。當以往的困境被改變,整個網絡運維系統(tǒng)的靈活性和可部署性也會隨之提高。過去傷筋動骨式的維修、擴展將不再重現。
換言之,在AI之力的影響下。交換機的應用模式會一改往日的沉重復,變得更加輕盈、更加簡單。
智能優(yōu)化之下,更多想象力的未來
對于網絡環(huán)境來說,今天更大的任務是要適應企業(yè)用戶不斷增大的AI算力需求,以及衍生的網絡依賴。網絡環(huán)境必須為AI任務大量普及,提供必要的網絡支持。不能等到數據泛濫,深度學習應用迫在眉睫,才發(fā)現原來路還沒鋪好。
基于AI芯片帶來的主動分析能力和實時學習能力,CloudEngine 16800應用上了華為獨創(chuàng)的iLossLess智能無損交換算法,提供網絡結構優(yōu)化和全網調度能力,滿足復雜AI任務在運行時需要的網絡空間。這一能力對于AI開發(fā)者和運用者來說,將針對未來越來越廣泛的AI需求,解決三大底層問題:
1、 解決以太網原生短板的丟包問題,提升AI任務精度以及場景一致性。應用上智能無損交換算法后,可以讓以太網實現零丟包,充分發(fā)揮AI算力,不會在從任務到場景的過程中產生誤差。
2、通過靈活的網絡調度,加速AI任務訓練,加快模型部署效率。同樣在智能無損交換算法下,數據中心可以根據流量模型實現自適應和自優(yōu)化,根據應用狀況自主進行資源調度,更加適應AI應用流量彈性空間較大的特征。
3、基于AI開發(fā)平臺,讓IT人員更好的加入AI,從另一個維度降低開發(fā)成本,最終實現AI快速低成本落地。這種更加普惠的模式,在企業(yè)進行智能化轉型時,提供了強大的推助力。
AI時代,并不只是算法的時代,同時也是滿足于AI運行,能夠把AI效能最大化的系列技術共同的時代。
此刻我們需要的不僅僅是AI技術本身的發(fā)展,還有一切與其相關技術的合力前行。其中,網絡基礎環(huán)境就是至關重要的一項。新一代的網絡產品,必須比等待中的產業(yè)格局走到更前面。而在產業(yè)智能化轉型的革命征程中,網絡產品絕非是在基層供給燃料的后備軍,而是要充當起先鋒和開路者的角色,才能讓這條漫長的征程走得更加順遂。
評論
查看更多