有時候,如果你在某個商業(yè)領(lǐng)域堅持上足夠長的時間,市場就會自己來找你。
數(shù)十年來,Xilinx(賽靈思)一直是現(xiàn)場可編程門陣列(FPGA)的領(lǐng)導(dǎo)者,至今仍然占有 60% 的市場份額。英特爾在大約三年前以 167 億美元的價格收購了 FPGA 領(lǐng)域的競爭對手 Altera,占據(jù)了大部分市場份額。
盡管 Xilinx 在過去幾年中取得了穩(wěn)定的增長,它在 2018 財年的收入比前一年增長了 8%,達(dá)到創(chuàng)紀(jì)錄的 25.4 億美元,但 FPGA 仍然剛剛開始在數(shù)據(jù)中心站穩(wěn)自己作為計算機引擎的地位的腳跟。
而英特爾、AMD 和 IBM 的 CPU 仍然是計算的主要驅(qū)動力,在 Nvidia 和 AMD 的 GPU 加速器的幫助下,一些前景光明的 Arm 陣營的公司希望希望能夠在 Cavium 的領(lǐng)導(dǎo)下參與到這場變革中來。
于是,越來越多像 FPGA 以及定制化 ASIC——這些 CPU 之外的加速器被人們所使用,但是目前大部分的數(shù)據(jù)中心中占據(jù)主導(dǎo)地位的處理器仍然是 CPU。
盡管如此,Victor Peng 這位在 Xilinx 工作了 10 年的老員工(自從今年 1 月份起擔(dān)任該公司 CEO),也看到了這種轉(zhuǎn)變,想著有朝一日可編程硅芯片會成為大型數(shù)據(jù)中心用戶、云平臺建設(shè)者使用的高性能計算中心,以及常規(guī)企業(yè)的數(shù)據(jù)中心中的計算驅(qū)動力。
計算機領(lǐng)域正經(jīng)歷著重要的變革,這導(dǎo)致人們對異構(gòu)計算的需求與日俱增,從而在不用改變?nèi)魏蔚讓蛹軜?gòu)的情況下能夠適應(yīng)手頭的工作量。特別是目前越來越多從核心到網(wǎng)絡(luò)邊緣再接入云端的終端正在被連接起來,并通過傳感器、攝像頭和其他設(shè)備被賦予了智能,它們創(chuàng)造了大量的非結(jié)構(gòu)化數(shù)據(jù)。
這些數(shù)據(jù)推動了對更強的計算能力和更大的存儲空間、使用人工智能 (AI) 和機器學(xué)習(xí)等技術(shù)的需求,從而使人們對這些數(shù)據(jù)有更好的感知和決策的能力。
正如我們在「The Next Platform」中談到的,F(xiàn)PGA 引起了人們對機器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的興趣,Xilinx 今年夏天則收購了以神經(jīng)網(wǎng)絡(luò)和 FPGA 為業(yè)務(wù)核心的初創(chuàng)公司 DeePhi。
Victor Peng 在硅谷舉行的 Hot Chips 2018 上發(fā)表的主旨演講中提到:“這種形式的智能化中的各個組成部分是完全相互聯(lián)系在一起的。這種情況切切實實地發(fā)生了,而且尚處于早期起步階段?!?/p>
尤其是從今天的角度來看,智能化意味著在某種程度上我們不僅僅擁有某種智能處理器(例如,系統(tǒng)級芯片,SOC),還要求所有的應(yīng)用都擁有某種形式的人工智能,這通常會融入某種形式的機器學(xué)習(xí)技術(shù)。
這種情況之所以讓人如此興奮,是因為它不僅已經(jīng)對人們的日常生活產(chǎn)生了影響,而且由于其剛剛興起,并且這個領(lǐng)域的變革正在以指數(shù)級的速度發(fā)生著,它對人們?nèi)粘I畹挠绊憰絹碓缴钸h(yuǎn)。
Peng 指出,有人預(yù)測在不久的將來每年的數(shù)據(jù)量將超過 10ZB,而且“從中獲得某種價值通常意味著對數(shù)據(jù)進(jìn)行處理,并以某種形式從原始數(shù)據(jù)中提取這些信息,這大大推動了大型數(shù)據(jù)中心中服務(wù)器數(shù)量的增長。數(shù)據(jù)中心的規(guī)模擴展地比我們以前所見到的要大得多,計算、存儲空間和內(nèi)存都在不斷增加?!?/p>
你可以看到,目前機器性能的增長也已經(jīng)跟上了數(shù)據(jù)處理和總的存儲空間那種指數(shù)級的增長速率。
有趣的事,人們認(rèn)為這一切都是通過各種各樣的大型數(shù)據(jù)中心用戶的廣告收入以及從云平臺構(gòu)建者的基礎(chǔ)設(shè)施服務(wù)獲利的。
然而,在這種情況下,仍然存在一個很大的問題,那就是摩爾定律,Peng 將其稱為‘’一個巨大的挑戰(zhàn)‘’。
摩爾定律告訴我們晶體管的尺寸會縮小,并且我們可以將更多的晶體管集成在一個特定的區(qū)域中,從而具備更強的處理能力以及更低的成本。50 年來,摩爾定律在這個行業(yè)中一直都十分有效,但如今這條定律已經(jīng)很難再維持下去了。
他說:‘’我們每個人都根深蒂固地認(rèn)為,即使是對于科技產(chǎn)品來說,日常消費者也希望能夠獲得處理速度更快、更便宜的產(chǎn)品‘’。
‘’實際上,我們每年都希望電子產(chǎn)品都能遵循這樣的物理定律:人們可以以同樣的價格得到能力更強的更好的產(chǎn)品。因此,當(dāng)我們說摩爾定律不再適用于我們今天的產(chǎn)業(yè)發(fā)展時,這種影響是十分深遠(yuǎn)的?!?/p>
多年來,芯片制造商已經(jīng)使用了各種手段來跟上摩爾定律的步伐,包括增加更多的核心,驅(qū)動芯片內(nèi)部的線程,以及利用各種加速器。
然而,Peng 認(rèn)為更快更好的系統(tǒng)不僅需要通過處理器技術(shù)實現(xiàn),還需要通過架構(gòu)來實現(xiàn)。系統(tǒng)架構(gòu)本身也面臨著諸多挑戰(zhàn),特別是功率和密度,這也限制了性能。
‘’過去的 40 年中,計算主要集中在 CPU 和微處理器上。‘’Peng 說。
‘’在本世紀(jì)的頭十年,這種狀況漸漸走到了盡頭。從 2010 年起,計算環(huán)境開始向異構(gòu)系統(tǒng)發(fā)展,這時我們的計算機所使用的處理器可以被分為通用處理器以及那些你可以廣泛稱之為固有硬件加速器的處理器。這樣的處理器可能是一個 CPU 或一個 MPU,當(dāng)然,在機器學(xué)習(xí)領(lǐng)域 ASIC 也漸漸復(fù)興起來?!?/p>
機器學(xué)習(xí)和其他現(xiàn)代計算工作,以及激增的連接起來的智能設(shè)備(數(shù)百億),正推動新一輪的對硅技術(shù)的投資和對可配置和適應(yīng)性強的硬件平臺的需求。異構(gòu)結(jié)構(gòu)設(shè)計將是推動性能提升的關(guān)鍵。
通過機器學(xué)習(xí)和所有這些相連的設(shè)備和系統(tǒng),‘’你不能把它們固定下來,因為你無法預(yù)測當(dāng)你部署這些設(shè)備時全部的需求將會是什么。而且你不會想要通過改變物理設(shè)備來為這些基礎(chǔ)設(shè)施賦予相應(yīng)的能力‘’。
‘’這種觀念不僅能夠在軟件層面上改變。在硬件層面上,遠(yuǎn)程的大型智能設(shè)備正變得越來越強大,而且為了滿足未來的計算需求,這種變革是絕對有必要的?!?/p>
圖:異構(gòu)計算架構(gòu)
在 Hot Chips 上,Peng 和其他 Xilinx 的官員在演講中談到了該公司接下來的戰(zhàn)略,包括即將推出的自適應(yīng)計算加速平臺 (ACAP) 和 7 納米工藝的「Everest」系統(tǒng)級芯片。
Xilinx 在三月份第一次談到 ACAP,雖然那時他們并沒有就此平臺深入介紹,但是 Peng 的確在這個項目上傾注了經(jīng)歷,在十月份 Xilinx 的開發(fā)者論壇上,他們很可能對這個平臺進(jìn)行深度展示。
Xilinx 表示,ACAP 將在機器學(xué)習(xí)推理方面為該公司現(xiàn)有的 16 納米 FPGA 提供 20 倍的性能提升,并且在 5G 網(wǎng)絡(luò)方面提供 4 北的性能提升。今年晚些時候,「Everest」將在***半導(dǎo)體制造公司的 7 納米工藝平臺上被生產(chǎn)出來。
圖:Everest 框架圖
ACAP 是針對適應(yīng)性和可編程性進(jìn)行設(shè)計的。該平臺的可編程引擎將從源頭解決機器學(xué)習(xí)推理和 5G 網(wǎng)絡(luò)工作的問題。
體系結(jié)構(gòu)的核心是一系列 Tile 單元,每個 Tile 單元都會表示一個互聯(lián)資源結(jié)構(gòu)以及可以針對特定應(yīng)用的可擴展本地內(nèi)存的特征。Xilinx 將提供一系列針對廣泛市場的 SKU(庫存量單位)。
可編程邏輯器件包含 DSP、LUT、URAM 以及 BRAM。按照 Peng 的設(shè)想,這個架構(gòu)將允許用戶為該架構(gòu)編寫程序,以最好地滿足應(yīng)用需求。這使得他們能夠為不同的工作部署相同的硅芯片。
Peng 說:‘’這將使交換內(nèi)核和 DSA 的輸入輸出能夠更快地進(jìn)行,同時減少設(shè)計的限制?!?/p>
‘’這是一個多元化的市場。目前有許多關(guān)于數(shù)據(jù)中心和云計算的討論,但是由于 AXAP 的靈活性和處理深度,它將服務(wù)于所有的市場。這個架構(gòu)師可擴展的,所以他可以在汽車中、在云應(yīng)用程序、通信間的設(shè)備上、基礎(chǔ)設(shè)施上被應(yīng)用。這種架構(gòu)從一開始就是軟件可編程的,但歸根到底它還是可編程硬件?!?/p>
這也會讓我們得到更高的吞吐量、更低的延遲和更低的功耗。當(dāng)我們談?wù)摤F(xiàn)在的計算工作時,這些參數(shù)都和頻率一樣重要。
Peng 說:‘’這些天來,特別是由于我們著眼于機器學(xué)習(xí)領(lǐng)域,我們正熱衷于提高 TOPS(評價指標(biāo))?!?/p>
‘’這讓我想起了 1990 年代的 Megahertz Wars。然而,真正重要的并不是這種指標(biāo),重要的是應(yīng)用程序的速度提升。我們通常以幾百兆赫或者大約千兆赫的頻率運行這些程序,而不是幾千兆赫。
這很大程度上是因為,由于我們的架構(gòu)需要有普適性,我們使用了很多分布時板載內(nèi)存及其互聯(lián)結(jié)構(gòu),甚至還有一些端口的配置都是可以自定義的。你不僅可以優(yōu)化數(shù)據(jù)通路和數(shù)據(jù)流,還可以優(yōu)化內(nèi)存的層次結(jié)構(gòu)和帶寬,而板載內(nèi)存的帶寬是很大的?!?/p>
-
芯片
+關(guān)注
關(guān)注
452文章
50206瀏覽量
420922 -
摩爾定律
+關(guān)注
關(guān)注
4文章
630瀏覽量
78892
原文標(biāo)題:摩爾定律難以維持,芯片已進(jìn)入由異構(gòu)驅(qū)動的世界
文章出處:【微信號:IC-008,微信公眾號:半導(dǎo)體那些事兒】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論