華為全場景AI方案構(gòu)建完成!
在今天深圳的發(fā)布會(huì)上,華為副董事長、輪值董事長徐直軍發(fā)布了最新商用AI芯片昇騰910(Ascend 910),以及首款國產(chǎn)的全場景AI計(jì)算框架——MindSpore計(jì)算框架。
至此,從去年發(fā)布“五大AI戰(zhàn)略”,短短一年時(shí)間,在各方壓力下的華為,已經(jīng)迅速完成了全場景AI方案的全部部件構(gòu)建。華為表示,接下來會(huì)專注于各部件的優(yōu)化和升級(jí)。
在答記者問的環(huán)節(jié)徐直軍也提到,“516事件”(美國商務(wù)部以國家安全為由,將華為公司及其70家附屬公司列入出口管制「實(shí)體名單」)對華為戰(zhàn)略推薦和全場景產(chǎn)品研發(fā)沒有任何影響,盡管外部環(huán)境發(fā)生了很多變化,但是整個(gè)AI戰(zhàn)略和產(chǎn)品商用依然在穩(wěn)步推進(jìn),也達(dá)到了預(yù)期結(jié)果。
而對于華為在計(jì)算框架生態(tài)的構(gòu)建上,如何與谷歌和Facebook等已經(jīng)長期耕耘的公司競爭的問題,徐直軍表示,華為的優(yōu)勢在于有自己的移動(dòng)終端產(chǎn)品,并且利用算力和計(jì)算框架結(jié)合,可以打造很多其他框架不能實(shí)現(xiàn)的功能。
其實(shí)在8月21日開幕的第31屆Hot Chips大會(huì)上,華為作為主角之一與AMD、Intel、ARM等巨頭同臺(tái)亮相時(shí),就推出了AI芯片所用的“Da Vinci(達(dá)芬奇)”架構(gòu),以及昇騰310、昇騰910芯片和麒麟810芯片。
昇騰310、昇騰910芯片早在去年10月10日的華為全鏈接2018大會(huì)上就已首次亮相。
聚焦低功耗的昇騰310已經(jīng)量產(chǎn)商用,那今天發(fā)布的昇騰910(Ascend 910)AI處理器和MindSpore計(jì)算框架又有什么新的亮點(diǎn)呢?
最新商用AI芯片昇騰910發(fā)布
先看昇騰910,據(jù)華為介紹,這款芯片在算力方面超過了預(yù)期,同等規(guī)格下,昇騰910達(dá)到并超過了C級(jí)規(guī)格,能在一個(gè)時(shí)鐘周期下完成4096次計(jì)算。
這個(gè)成績得益于基于達(dá)芬奇架構(gòu)的AI核的計(jì)算核心,除了標(biāo)量和矢量計(jì)算單元,AI核集成了3D立方體計(jì)算引擎,與CPU和GPU相比,有兩個(gè)數(shù)量級(jí)上的提升。
昇騰910更是集成了32個(gè)立方體計(jì)算引擎,能夠輸出256TFLOPS(每秒256萬億次浮點(diǎn)指令),所以昇騰910不僅是一個(gè)AI芯片,更是一個(gè)高度集成的片上系統(tǒng),集成了CPU、DVBP及任務(wù)管理器。
同時(shí)昇騰910擁有自治能力,使其可以獨(dú)立完成整個(gè)AI訓(xùn)練流程,最小化和Host的交互,從而發(fā)揮其強(qiáng)大的算力。
再看昇騰910的通信機(jī)制,昇騰910集成了HCCS、PCLe和RoCE三種高速接口,其中自研的HCCS可以提供單接口240Gbps的傳輸,從而實(shí)現(xiàn)芯片構(gòu)建訓(xùn)練系統(tǒng)的性能和靈活性的大幅提升。
華為也表示,將繼續(xù)面向未來投資,針對不同場景進(jìn)行研發(fā),提供更強(qiáng)大經(jīng)濟(jì)的算力需求。昇騰310、昇騰910僅僅是一個(gè)開始,未來將推出昇騰920。
在價(jià)格上,華為也表示,這款芯片的售價(jià)還沒有確定,但是絕不會(huì)高于同性能芯片的售價(jià)。
發(fā)布首款國產(chǎn)全場景AI計(jì)算框架——MindSpore
接下來,華為還發(fā)布了一款全場景AI計(jì)算框架——MindSpore。
徐直軍表示,目前國內(nèi)還沒有一款能夠?qū)?biāo)Tensorflow的全場景AI計(jì)算框架,MindSpore希望能夠彌補(bǔ)國內(nèi)的這一空白。
在性能上,MindSpore對開發(fā)者非常友好,能夠有效減少模型開發(fā)時(shí)間,降低開發(fā)門檻。相同場景需求下,減少模型代碼量20%,效率能夠整體提升50%以上。
具體來說,MindSpore自動(dòng)微分采用Source 2 Source方式實(shí)現(xiàn),在性能和可編程性上,明顯優(yōu)于業(yè)界圖和運(yùn)算符重載方式,同時(shí)能夠?qū)崿F(xiàn)任意算子的微分表達(dá)和編譯優(yōu)化,實(shí)現(xiàn)反向算子自動(dòng)生成,從而極大方便模型開發(fā)。
隨著數(shù)據(jù)集和模型規(guī)模越來越大,模型并行成為必然,手工切分的模型并行存在門檻高、效率低、調(diào)優(yōu)難的缺陷,而MindSpore只需要定義單機(jī)模型,即可實(shí)現(xiàn)多機(jī)混合并行運(yùn)行,無需了解AI集群細(xì)節(jié)。
MindSpore同時(shí)支持靜態(tài)圖和動(dòng)態(tài)圖,且可用一條語句實(shí)現(xiàn)無縫切換,從而讓調(diào)試也變得簡單而高效。
不僅有開發(fā)態(tài)的高效,運(yùn)行態(tài)的友好同樣是MindSpore的追求目標(biāo)。MindSpore大大提高了運(yùn)算性能,并且除了支持華為的昇騰910外,也支持其他業(yè)界其他CPU、GPU。
MindSpore還提供了Ascend Native運(yùn)行技術(shù),助力昇騰算力最佳發(fā)揮。主從控制模式中,CPU和GPU交互,引入內(nèi)存和數(shù)據(jù)開銷,在芯片上完成神經(jīng)網(wǎng)絡(luò)模型所需要的所有控制和執(zhí)行。
至于很多人問為什么有了TensorFlow還要開發(fā)MindSpore,徐直軍表示:目前沒有任何一個(gè)國產(chǎn)框架支持全場景。華為目前的業(yè)務(wù)包括云、端、邊,這些都需要全場景支持的AI框架。在不同的運(yùn)行環(huán)境中,架構(gòu)上支持可大可小,適應(yīng)全部場景部署。
在隱私保護(hù)方面,MindSpore不帶有隱私信息的梯度模型,能夠在保證保護(hù)用戶隱私的前提下,跨場景協(xié)同。
總的來說,支持端、邊、云獨(dú)立和協(xié)同的統(tǒng)一訓(xùn)練和推理的MindSpore計(jì)算框架,降低了AI的開發(fā)和使用門檻,釋放AI生產(chǎn)力,最大程度發(fā)揮AI芯片算力潛力,從而鼓勵(lì)開發(fā)人員共同打造AI生態(tài),推動(dòng)AI產(chǎn)業(yè)落地。
華為稱,MindSpore將在明年一季度開源,讓更多開發(fā)者參與將MindSpore打造好。
華為全場景AI構(gòu)建方案完成
最后,讓我們再回顧一下華為去年發(fā)布的AI五大戰(zhàn)略:
投資基礎(chǔ)研究:在計(jì)算視覺、自然語言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動(dòng)自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力
打造全棧方案:打造面向云、邊緣和端等全場景的、獨(dú)立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺(tái)
投資開放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開放生態(tài),培養(yǎng)人工智能人才
解決方案增強(qiáng):把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù),實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競爭力
內(nèi)部效率提升:應(yīng)用AI優(yōu)化內(nèi)部管理,對準(zhǔn)海量作業(yè)場景,大幅度提升內(nèi)部運(yùn)營效率和質(zhì)量
而今年芯片和計(jì)算架構(gòu)的發(fā)布,也是華為對這一戰(zhàn)略的落地實(shí)踐。這也標(biāo)志著華為全場景AI構(gòu)建方案完成。
目前從世界范圍來看,在桌面CPU上,Intel和AMD處于絕對的統(tǒng)治地位;GPU方面,則是英偉達(dá)在領(lǐng)跑;至于手機(jī)處理器,則基本握在了ARM手中。盡管華為有備胎計(jì)劃,但是性能方面預(yù)計(jì)很難超過這些技術(shù)成熟、人才資本雄厚的企業(yè)。
深圳半導(dǎo)體協(xié)會(huì)秘書長常軍鋒曾指出,國外半導(dǎo)體巨頭通過國際標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、專利保護(hù)建立了技術(shù)壁壘。
AI芯片,則成為了國產(chǎn)芯片彎道超車的絕佳機(jī)會(huì)。
AI芯片從發(fā)育到成熟落地,國內(nèi)基本和國外大廠處于同一起跑線上,并且如今華為昇騰系列已經(jīng)商業(yè)化,昇騰910作為是目前單芯片計(jì)算密度最大的芯片,計(jì)算力也超過了谷歌及英偉達(dá)競品。
-
華為
+關(guān)注
關(guān)注
215文章
34125瀏覽量
249437 -
AI
+關(guān)注
關(guān)注
87文章
28862瀏覽量
266183 -
AI芯片
+關(guān)注
關(guān)注
17文章
1828瀏覽量
34661
發(fā)布評論請先 登錄
相關(guān)推薦
評論