在昨日舉行的華為全連接大會(huì)上,華為終于揭開了其自研AI芯片的神秘面紗。
據(jù)華為輪值總裁徐直軍介紹,華為這次推出的兩款芯片分別是昇騰910和昇騰310,這都是華為基于其自研的達(dá)芬奇架構(gòu)打造的兩款新品。其中昇騰910是當(dāng)前單芯片計(jì)算密度最大的AI芯片。該產(chǎn)品采用7nm工藝打造,最大功耗做到350w,其他參數(shù)也是表現(xiàn)優(yōu)越:在半精度 (FP16)下,可以做到256 TeraFLOPS,在整數(shù)精度 (INT8)下,更是做到了512 TeraOPS,另外,該款芯片還支持128 通道的全高清視頻解碼器(H.264/265)。
華為昇騰910介紹
徐直軍表示,華為昇騰910在與英偉達(dá)和谷歌的芯片對(duì)比時(shí),也擁有強(qiáng)大的領(lǐng)先優(yōu)勢(shì)。芯片將在2019年Q2到來(lái),這會(huì)在云端給華為帶來(lái)訓(xùn)練和邏輯服務(wù)系列的強(qiáng)大支持,沖破現(xiàn)在市場(chǎng)被TPU和英偉達(dá)壟斷的局面。
華為昇騰910介紹
另外,華為還發(fā)布了昇騰310,按照徐直軍的說(shuō)法,華為這款極致高效計(jì)算低功耗的AI SoC是針對(duì)邊緣AI而推出的產(chǎn)品。作為一款同樣采用達(dá)芬奇架構(gòu)的芯片,華為昇騰310采用了12nm FFC工藝制造,在半精度 (FP16)情況下,可以做到8 TeraFLOPS,在整數(shù)精度 (INT8) 下,則能做到16 TeraOPS,還能支持16 通道全高清視頻解碼器 - H.264/265,而其最大功耗只有8W,這款芯片現(xiàn)在就已經(jīng)能夠給客戶提供全方位的支持。
華為昇騰310介紹
華為方面表示,他們基于統(tǒng)一、可擴(kuò)展架構(gòu)的系列化 AI IP和芯片昇騰擁有nano、tiny、mini、lite和max五個(gè)系列,能提供橫跨全場(chǎng)景的最優(yōu)TOPS/W支持。
徐直軍在接受采訪的時(shí)候向記者強(qiáng)調(diào),華為的昇騰芯片將不會(huì)對(duì)外單獨(dú)銷售,而是以AI加速卡、加速模塊、服務(wù)器和一體機(jī)等模式對(duì)外銷售。華為的全棧AI戰(zhàn)略也在昇騰面世之后,得到了全方位補(bǔ)全。
華為的AI解決方案
在面向未來(lái)的AI機(jī)會(huì),華為將會(huì)聚焦在投資基礎(chǔ)研究、打造全棧方案、投資開放生態(tài)和人才培養(yǎng)、解決方案增強(qiáng)和內(nèi)部效率提升這五個(gè)方面。具體而言就是:
在計(jì)算視覺(jué)、 自然語(yǔ)言處理、 決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、 能耗高效(更低的算力和能耗),安全可信、自動(dòng)自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力;
打造面向云、 邊緣和端等全場(chǎng)景的、 獨(dú)立的以及協(xié)同的、 全棧解決方案, 提供充裕的、 經(jīng)濟(jì)的算力資源, 簡(jiǎn)單易用、 高效率、 全流程的AI平臺(tái);
面向全球, 持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作;
把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù), 實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競(jìng)爭(zhēng)力;
應(yīng)用AI優(yōu)化內(nèi)部管理, 對(duì)準(zhǔn)海量作業(yè)場(chǎng)景, 大幅度提升內(nèi)部運(yùn)營(yíng)效率和質(zhì)量;
華為這些新產(chǎn)品的推出,在業(yè)界引起了廣泛討論。無(wú)獨(dú)有偶,筆者也從知情人士處看到了華為的Arm服務(wù)器芯片的相關(guān)產(chǎn)品曝光。
華為7納米Arm服務(wù)器芯片曝光
日前,華為正式對(duì)外披露了其新一代的Arm服務(wù)器芯片Hi 1620。
據(jù)知情人士告訴半導(dǎo)體行業(yè)觀察記者,華為這顆Arm服務(wù)器芯片是基于Arm V8 架構(gòu)自主設(shè)計(jì)的,使用當(dāng)前業(yè)界最先進(jìn)的7nm工藝打造。據(jù)了解,華為在此芯片上提供32、48和64核的版本,最高支持2.6/3.0Ghz的主頻,能夠支持PCIE 4.0&CCIX。
華為方面表示,這是業(yè)界第一顆支持PCIE4.0的7納米Arm服務(wù)器芯片。從華為的PPT中我們可以看到,Hi 1620的48核版本的CPU和英特爾Skylake 8180 的SPECint 性能相當(dāng),但在功耗方面會(huì)比后者低20%。
華為Hi 1620的細(xì)節(jié)
作為一個(gè)涉足廣泛的企業(yè),華為的Arm服務(wù)器芯片已經(jīng)有了多代的發(fā)展。
從wikichip可以看到,2015年,華為推出了其第一代Arm服務(wù)器芯片Hi 1610,這個(gè)采用Arm Cortex-A57設(shè)計(jì)的16核芯片主頻最高只能做到2.1Ghz。
在2016年,中國(guó)十二五科技創(chuàng)新成就展上,華為展出了其第一臺(tái)ARM平臺(tái)服務(wù)器“泰山”(Taishan),配備自主研發(fā)ARM架構(gòu)64位處理器“Hi1612”,采用臺(tái)積電16nm工藝打造,兼容ARMv8-A指令集。華為方面表示,除了存儲(chǔ)單元外,該處理器具有完整的自主知識(shí)產(chǎn)權(quán),可應(yīng)用于大數(shù)據(jù)分析、共有云、信息搜索等領(lǐng)域,并已在阿里巴巴試用。
2017年,華為又推出了HI 1616,這個(gè)采用Cortex-A72設(shè)計(jì)的32核芯片最高主頻可以做到3Ghz,再到今年Hi 1620??梢钥吹剑m然華為并沒(méi)有大肆宣傳其Arm服務(wù)器芯片,但是在過(guò)去的幾年也都保持每年一款的更新頻率。
華為Arm服務(wù)器芯片系列
考慮到華為本身在手機(jī)、云和存儲(chǔ)等方面的影響力,這個(gè)Arm服務(wù)器產(chǎn)品的到來(lái),對(duì)于華為本身,是對(duì)自身產(chǎn)業(yè)鏈的進(jìn)一步完善。能夠?yàn)榭蛻籼峁┒ㄖ苹?、全方位的可控一條龍服務(wù)。
放大到整個(gè)中國(guó)集成電路產(chǎn)業(yè)來(lái)說(shuō),華為的這個(gè)系列產(chǎn)品線或許能在英特爾把持的服務(wù)器芯片市場(chǎng)殺出一條新路。但毫無(wú)疑問(wèn),這將會(huì)面臨來(lái)自國(guó)內(nèi)外的多個(gè)競(jìng)爭(zhēng)對(duì)手的挑戰(zhàn)。
暗流涌動(dòng)的Arm服務(wù)器芯片市場(chǎng)
近年來(lái),隨著Intel服務(wù)器芯片的市場(chǎng)份額的日益攀升,國(guó)內(nèi)自主可控需求的興起,Marvell收購(gòu)Cavium、華芯通的成立、高通的淡出,Arm服務(wù)器芯片市場(chǎng)一直暗流涌動(dòng)。雖然開始有些人在退出,但在Arm的推動(dòng)下,也有新的玩家進(jìn)入這個(gè)市場(chǎng),華為就是當(dāng)中一個(gè)代表。正如上文所說(shuō),從華為的業(yè)務(wù)上看,Arm服務(wù)器芯片業(yè)務(wù)對(duì)他們來(lái)說(shuō)是一個(gè)產(chǎn)業(yè)鏈環(huán)節(jié)的補(bǔ)充。
除了華為之外,國(guó)內(nèi)的飛騰、華芯通,美國(guó)的Ampere也都是Arm服務(wù)器市場(chǎng)的重要角色。
首先看一下飛騰方面。
早前,天津飛騰信息技術(shù)有限公司首席科學(xué)家竇強(qiáng)在接受半導(dǎo)體行業(yè)觀察等媒體采訪的時(shí)候提到,飛騰在2017年推出了飛騰FT2000+處理器,這個(gè)使用16nm工藝打造的芯片擁有64個(gè)內(nèi)核、主頻可以做到1.8-2.3GHz,以標(biāo)準(zhǔn)spec測(cè)試的實(shí)測(cè)性能和英特爾2013年推出的至強(qiáng)處理器性能相當(dāng),飛騰也完成了服務(wù)器存儲(chǔ)、數(shù)據(jù)庫(kù)和中間件適配的相關(guān)工作。
在竇強(qiáng)看來(lái),飛騰這個(gè)處理器性能和英特爾的產(chǎn)品相比還有很大的差距,甚至他們這款產(chǎn)品還是單路設(shè)計(jì),不能滿足大規(guī)模的設(shè)計(jì)需求。但是飛騰未來(lái)會(huì)將其擴(kuò)展兩路,甚至八路,以匹配高端服務(wù)器的處理器需求。
飛騰公司總經(jīng)理谷虹之前說(shuō)過(guò),飛騰的CPU雖然是基于ARM技術(shù)架構(gòu)研發(fā),但包括CPU計(jì)算模塊在內(nèi)的代碼部分均為公司歷時(shí)多年自主研發(fā)完成。這就使得飛騰能夠在這系列產(chǎn)品的自主可控上面,擁有更高的自主權(quán)。
來(lái)到華芯通,這是由貴州政府和高通共同成立的,專注于Arm服務(wù)器芯片的企業(yè)。
據(jù)鳳凰科技在今年五月的報(bào)道,華芯通自主研發(fā)的第一款服務(wù)器芯片——“華芯1號(hào)”已經(jīng)于2017年年底試產(chǎn)流片成功,并將于今年下半年上市商用。而他們研發(fā)的第二代產(chǎn)品“華芯3號(hào)”目前已經(jīng)在研制當(dāng)中。
據(jù)報(bào)道,這款服務(wù)器芯片只有半張銀行卡大,集成了約10億個(gè)晶體管和2800多個(gè)管腳,芯片制程為10納米。通過(guò)內(nèi)置自主安全模塊大大提升芯片安全系數(shù),是“華芯1號(hào)”的一大亮點(diǎn),它可以應(yīng)用在高性能計(jì)算機(jī)上面,發(fā)揮迅速及時(shí)處理龐大數(shù)據(jù)的功能。
至于Ampere,則是由Intel前高管Renee James創(chuàng)立的。在半導(dǎo)體行業(yè)觀察之前對(duì)James女士發(fā)起的專訪中她提到,Ampere的核心團(tuán)隊(duì)大部分來(lái)自Intel和AMD這些芯片巨頭,公司的大多數(shù)人在服務(wù)器的軟硬件領(lǐng)域擁有非常豐富的經(jīng)驗(yàn),他們對(duì)服務(wù)器芯片和軟件的理解相當(dāng)深入,這就使得他們成為Arm服務(wù)器領(lǐng)域的新興勢(shì)力。
在今年九月,Ampere推出了該公司旗下面向數(shù)據(jù)中心的第一代 64 位 Armv8-A架構(gòu)的,16nm工藝打造的處理器,這款他們?cè)O(shè)計(jì)的 32 核 Armv8-A 處理器在Turbo 模式下主頻高達(dá) 3.3 GHz。處理器已獲得聯(lián)想及其他幾家原始設(shè)計(jì)制造商 (ODM) 的選擇。
按照他們的說(shuō)法,這款處理器具有優(yōu)秀的總體擁有成本 (TCO) 價(jià)值、強(qiáng)大的計(jì)算性能和內(nèi)存容量以及豐富的 I/O,用來(lái)處理云工作負(fù)載,包括大數(shù)據(jù)、Web 層以及內(nèi)存數(shù)據(jù)庫(kù)。
Ampere 還公布了未來(lái)多代產(chǎn)品路線圖,包括下一代 的7nm 產(chǎn)品等。這款產(chǎn)品將提供單插口和多插口選項(xiàng),并于 2019 年上市,這將用于將來(lái)的超大規(guī)模云計(jì)算和邊緣計(jì)算。
上述可見(jiàn),華為在Arm服務(wù)器芯片方面的領(lǐng)先優(yōu)勢(shì)領(lǐng)先于全球的競(jìng)爭(zhēng)對(duì)手。
總結(jié)
雖然華為的Arm服務(wù)器芯片迄今為止一枝獨(dú)秀,但我們可以看到,英特爾花費(fèi)數(shù)十年打造下的服務(wù)器生態(tài)是無(wú)法撼動(dòng)的。但華為依賴于其多年來(lái)積累的芯片設(shè)計(jì)經(jīng)驗(yàn),又在一個(gè)領(lǐng)域走在了全球前年。加上華為本身在AI芯片、ISP芯片、手機(jī)SoC和其他各種芯片、終端和應(yīng)用上的積累,華為未來(lái)在Arm服務(wù)器市場(chǎng)必將扮演一個(gè)重要角色。
至于未來(lái),就看Arm如何聯(lián)合各大芯片供應(yīng)商、軟件廠商在這個(gè)領(lǐng)域的生態(tài)上共同發(fā)力了。
-
華為
+關(guān)注
關(guān)注
215文章
34263瀏覽量
251041 -
服務(wù)器芯片
+關(guān)注
關(guān)注
2文章
122瀏覽量
19236 -
AI芯片
+關(guān)注
關(guān)注
17文章
1851瀏覽量
34865
原文標(biāo)題:不止AI,華為曝光全球首顆7納米Arm服務(wù)器芯片
文章出處:【微信號(hào):iawbs2016,微信公眾號(hào):寬禁帶半導(dǎo)體技術(shù)創(chuàng)新聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論