在昨日舉行的華為全連接大會上,華為終于揭開了其自研AI芯片的神秘面紗。
據(jù)華為輪值總裁徐直軍介紹,華為這次推出的兩款芯片分別是昇騰910和昇騰310,這都是華為基于其自研的達(dá)芬奇架構(gòu)打造的兩款新品。其中昇騰910是當(dāng)前單芯片計算密度最大的AI芯片。該產(chǎn)品采用7nm工藝打造,最大功耗做到350w,其他參數(shù)也是表現(xiàn)優(yōu)越:在半精度 (FP16)下,可以做到256 TeraFLOPS,在整數(shù)精度 (INT8)下,更是做到了512 TeraOPS,另外,該款芯片還支持128 通道的全高清視頻解碼器(H.264/265)。
華為昇騰910介紹
徐直軍表示,華為昇騰910在與英偉達(dá)和谷歌的芯片對比時,也擁有強(qiáng)大的領(lǐng)先優(yōu)勢。芯片將在2019年Q2到來,這會在云端給華為帶來訓(xùn)練和邏輯服務(wù)系列的強(qiáng)大支持,沖破現(xiàn)在市場被TPU和英偉達(dá)壟斷的局面。
華為昇騰910介紹
另外,華為還發(fā)布了昇騰310,按照徐直軍的說法,華為這款極致高效計算低功耗的AI SoC是針對邊緣AI而推出的產(chǎn)品。作為一款同樣采用達(dá)芬奇架構(gòu)的芯片,華為昇騰310采用了12nm FFC工藝制造,在半精度 (FP16)情況下,可以做到8 TeraFLOPS,在整數(shù)精度 (INT8) 下,則能做到16 TeraOPS,還能支持16 通道全高清視頻解碼器 - H.264/265,而其最大功耗只有8W,這款芯片現(xiàn)在就已經(jīng)能夠給客戶提供全方位的支持。
華為昇騰310介紹
華為方面表示,他們基于統(tǒng)一、可擴(kuò)展架構(gòu)的系列化 AI IP和芯片昇騰擁有nano、tiny、mini、lite和max五個系列,能提供橫跨全場景的最優(yōu)TOPS/W支持。
徐直軍在接受采訪的時候向記者強(qiáng)調(diào),華為的昇騰芯片將不會對外單獨(dú)銷售,而是以AI加速卡、加速模塊、服務(wù)器和一體機(jī)等模式對外銷售。華為的全棧AI戰(zhàn)略也在昇騰面世之后,得到了全方位補(bǔ)全。
華為的AI解決方案
在面向未來的AI機(jī)會,華為將會聚焦在投資基礎(chǔ)研究、打造全棧方案、投資開放生態(tài)和人才培養(yǎng)、解決方案增強(qiáng)和內(nèi)部效率提升這五個方面。具體而言就是:
在計算視覺、 自然語言處理、 決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、 能耗高效(更低的算力和能耗),安全可信、自動自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力;
打造面向云、 邊緣和端等全場景的、 獨(dú)立的以及協(xié)同的、 全棧解決方案, 提供充裕的、 經(jīng)濟(jì)的算力資源, 簡單易用、 高效率、 全流程的AI平臺;
面向全球, 持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作;
把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù), 實現(xiàn)更大價值、更強(qiáng)競爭力;
應(yīng)用AI優(yōu)化內(nèi)部管理, 對準(zhǔn)海量作業(yè)場景, 大幅度提升內(nèi)部運(yùn)營效率和質(zhì)量;
華為這些新產(chǎn)品的推出,在業(yè)界引起了廣泛討論。無獨(dú)有偶,筆者也從知情人士處看到了華為的Arm服務(wù)器芯片的相關(guān)產(chǎn)品曝光。
華為7納米
Arm服務(wù)器芯片曝光
日前,華為正式對外披露了其新一代的Arm服務(wù)器芯片Hi 1620。
據(jù)知情人士告訴半導(dǎo)體行業(yè)觀察記者,華為這顆Arm服務(wù)器芯片是基于Arm V8 架構(gòu)自主設(shè)計的,使用當(dāng)前業(yè)界最先進(jìn)的7nm工藝打造。據(jù)了解,華為在此芯片上提供32、48和64核的版本,最高支持2.6/3.0Ghz的主頻,能夠支持PCIE 4.0&CCIX。
華為方面表示,這是業(yè)界第一顆支持PCIE4.0的7納米Arm服務(wù)器芯片。從華為的PPT中我們可以看到,Hi 1620的48核版本的CPU和英特爾Skylake 8180 的SPECint 性能相當(dāng),但在功耗方面會比后者低20%。
華為Hi 1620的細(xì)節(jié)
作為一個涉足廣泛的企業(yè),華為的Arm服務(wù)器芯片已經(jīng)有了多代的發(fā)展。
從wikichip可以看到,2015年,華為推出了其第一代Arm服務(wù)器芯片Hi 1610,這個采用Arm Cortex-A57設(shè)計的16核芯片主頻最高只能做到2.1Ghz。
在2016年,中國十二五科技創(chuàng)新成就展上,華為展出了其第一臺ARM平臺服務(wù)器“泰山”(Taishan),配備自主研發(fā)ARM架構(gòu)64位處理器“Hi1612”,采用臺積電16nm工藝打造,兼容ARMv8-A指令集。華為方面表示,除了存儲單元外,該處理器具有完整的自主知識產(chǎn)權(quán),可應(yīng)用于大數(shù)據(jù)分析、共有云、信息搜索等領(lǐng)域,并已在阿里巴巴試用。
2017年,華為又推出了HI 1616,這個采用Cortex-A72設(shè)計的32核芯片最高主頻可以做到3Ghz,再到今年Hi 1620??梢钥吹?,雖然華為并沒有大肆宣傳其Arm服務(wù)器芯片,但是在過去的幾年也都保持每年一款的更新頻率。
華為Arm服務(wù)器芯片系列
考慮到華為本身在手機(jī)、云和存儲等方面的影響力,這個Arm服務(wù)器產(chǎn)品的到來,對于華為本身,是對自身產(chǎn)業(yè)鏈的進(jìn)一步完善。能夠為客戶提供定制化、全方位的可控一條龍服務(wù)。
放大到整個中國集成電路產(chǎn)業(yè)來說,華為的這個系列產(chǎn)品線或許能在英特爾把持的服務(wù)器芯片市場殺出一條新路。但毫無疑問,這將會面臨來自國內(nèi)外的多個競爭對手的挑戰(zhàn)。
暗流涌動的
Arm服務(wù)器芯片市場
近年來,隨著Intel服務(wù)器芯片的市場份額的日益攀升,國內(nèi)自主可控需求的興起,Marvell收購Cavium、華芯通的成立、高通的淡出,Arm服務(wù)器芯片市場一直暗流涌動。雖然開始有些人在退出,但在Arm的推動下,也有新的玩家進(jìn)入這個市場,華為就是當(dāng)中一個代表。正如上文所說,從華為的業(yè)務(wù)上看,Arm服務(wù)器芯片業(yè)務(wù)對他們來說是一個產(chǎn)業(yè)鏈環(huán)節(jié)的補(bǔ)充。
除了華為之外,國內(nèi)的飛騰、華芯通,美國的Ampere也都是Arm服務(wù)器市場的重要角色。
首先看一下飛騰方面。
早前,天津飛騰信息技術(shù)有限公司首席科學(xué)家竇強(qiáng)在接受半導(dǎo)體行業(yè)觀察等媒體采訪的時候提到,飛騰在2017年推出了飛騰FT2000+處理器,這個使用16nm工藝打造的芯片擁有64個內(nèi)核、主頻可以做到1.8-2.3GHz,以標(biāo)準(zhǔn)spec測試的實測性能和英特爾2013年推出的至強(qiáng)處理器性能相當(dāng),飛騰也完成了服務(wù)器存儲、數(shù)據(jù)庫和中間件適配的相關(guān)工作。
在竇強(qiáng)看來,飛騰這個處理器性能和英特爾的產(chǎn)品相比還有很大的差距,甚至他們這款產(chǎn)品還是單路設(shè)計,不能滿足大規(guī)模的設(shè)計需求。但是飛騰未來會將其擴(kuò)展兩路,甚至八路,以匹配高端服務(wù)器的處理器需求。
飛騰公司總經(jīng)理谷虹之前說過,飛騰的CPU雖然是基于ARM技術(shù)架構(gòu)研發(fā),但包括CPU計算模塊在內(nèi)的代碼部分均為公司歷時多年自主研發(fā)完成。這就使得飛騰能夠在這系列產(chǎn)品的自主可控上面,擁有更高的自主權(quán)。
來到華芯通,這是由貴州政府和高通共同成立的,專注于Arm服務(wù)器芯片的企業(yè)。
據(jù)鳳凰科技在今年五月的報道,華芯通自主研發(fā)的第一款服務(wù)器芯片——“華芯1號”已經(jīng)于2017年年底試產(chǎn)流片成功,并將于今年下半年上市商用。而他們研發(fā)的第二代產(chǎn)品“華芯3號”目前已經(jīng)在研制當(dāng)中。
據(jù)報道,這款服務(wù)器芯片只有半張銀行卡大,集成了約10億個晶體管和2800多個管腳,芯片制程為10納米。通過內(nèi)置自主安全模塊大大提升芯片安全系數(shù),是“華芯1號”的一大亮點(diǎn),它可以應(yīng)用在高性能計算機(jī)上面,發(fā)揮迅速及時處理龐大數(shù)據(jù)的功能。
至于Ampere,則是由Intel前高管Renee James創(chuàng)立的。在半導(dǎo)體行業(yè)觀察之前對James女士發(fā)起的專訪中她提到,Ampere的核心團(tuán)隊大部分來自Intel和AMD這些芯片巨頭,公司的大多數(shù)人在服務(wù)器的軟硬件領(lǐng)域擁有非常豐富的經(jīng)驗,他們對服務(wù)器芯片和軟件的理解相當(dāng)深入,這就使得他們成為Arm服務(wù)器領(lǐng)域的新興勢力。
在今年九月,Ampere推出了該公司旗下面向數(shù)據(jù)中心的第一代 64 位 Armv8-A架構(gòu)的,16nm工藝打造的處理器,這款他們設(shè)計的 32 核 Armv8-A 處理器在Turbo 模式下主頻高達(dá) 3.3 GHz。處理器已獲得聯(lián)想及其他幾家原始設(shè)計制造商 (ODM) 的選擇。
按照他們的說法,這款處理器具有優(yōu)秀的總體擁有成本 (TCO) 價值、強(qiáng)大的計算性能和內(nèi)存容量以及豐富的 I/O,用來處理云工作負(fù)載,包括大數(shù)據(jù)、Web 層以及內(nèi)存數(shù)據(jù)庫。
Ampere 還公布了未來多代產(chǎn)品路線圖,包括下一代 的7nm 產(chǎn)品等。這款產(chǎn)品將提供單插口和多插口選項,并于 2019 年上市,這將用于將來的超大規(guī)模云計算和邊緣計算。
上述可見,華為在Arm服務(wù)器芯片方面的領(lǐng)先優(yōu)勢領(lǐng)先于全球的競爭對手。
總結(jié)
雖然華為的Arm服務(wù)器芯片迄今為止一枝獨(dú)秀,但我們可以看到,英特爾花費(fèi)數(shù)十年打造下的服務(wù)器生態(tài)是無法撼動的。但華為依賴于其多年來積累的芯片設(shè)計經(jīng)驗,又在一個領(lǐng)域走在了全球前年。加上華為本身在AI芯片、ISP芯片、手機(jī)SoC和其他各種芯片、終端和應(yīng)用上的積累,華為未來在Arm服務(wù)器市場必將扮演一個重要角色。
至于未來,就看Arm如何聯(lián)合各大芯片供應(yīng)商、軟件廠商在這個領(lǐng)域的生態(tài)上共同發(fā)力了。
文/半導(dǎo)體行業(yè)觀察 李壽鵬
點(diǎn)擊閱讀原文了解摩爾精英
原文標(biāo)題:不止AI,華為曝光全球首顆7納米Arm服務(wù)器芯片
文章出處:【微信公眾號:半導(dǎo)體科技評論】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
芯片
+關(guān)注
關(guān)注
452文章
50224瀏覽量
420992 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8965瀏覽量
85087 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3752瀏覽量
64235
發(fā)布評論請先 登錄
相關(guān)推薦
評論