0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何走出摩爾定律困境?摩爾定律領(lǐng)域的困境與研究方向詳細(xì)概述

DPVg_AI_era ? 來(lái)源:未知 ? 作者:易水寒 ? 2018-06-12 18:29 ? 次閱讀

計(jì)算機(jī)體系結(jié)構(gòu)頂會(huì)ISCA-18上周結(jié)束,圖靈獎(jiǎng)得主John Hennessy和David Patterson發(fā)表特邀報(bào)告,展望體系結(jié)構(gòu)新的黃金時(shí)代。本屆會(huì)議近1/3的論文關(guān)于神經(jīng)網(wǎng)絡(luò)加速器,專用領(lǐng)域架構(gòu)和軟硬件協(xié)同設(shè)計(jì)是最受關(guān)注的議題。谷歌、Facebook等非傳統(tǒng)硬件公司的存在感也愈發(fā)強(qiáng)烈。加州大學(xué)圣芭芭拉分校(UCSB)謝源課題組神經(jīng)網(wǎng)絡(luò)架構(gòu)研究團(tuán)隊(duì)博士后胡杏、鄧?yán)凇⒅x新峰、谷芃和劉瀏對(duì)大會(huì)技術(shù)趨勢(shì)做了總結(jié)。

ISCA是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的頂級(jí)會(huì)議,本屆ISCA的亮點(diǎn)無(wú)疑是新當(dāng)選的圖靈獎(jiǎng)得主、體系結(jié)構(gòu)領(lǐng)域的兩位宗師級(jí)人物John L. Hennessy和David A. Patterson做的特邀報(bào)告。

本文將先從兩位圖靈獎(jiǎng)得主的報(bào)告講起,總結(jié)會(huì)議關(guān)鍵技術(shù)趨勢(shì),展現(xiàn)與會(huì)專家的觀點(diǎn)與評(píng)論,最后對(duì)論文接收和子領(lǐng)域熱度等會(huì)議情況進(jìn)行介紹。

從這屆會(huì)議中可以發(fā)現(xiàn)四大關(guān)鍵技術(shù)趨勢(shì),

專用架構(gòu)與軟硬件協(xié)同設(shè)計(jì)將是未來(lái)專有化架構(gòu)研究趨勢(shì),也將是走出摩爾定律困境一個(gè)富有前景的方向;

神經(jīng)網(wǎng)絡(luò)加速器開(kāi)始從設(shè)計(jì)走向落地;

由于Meltdown和Spectre,硬件安全性得到更多關(guān)注。安全領(lǐng)域的研究方法除軟件、系統(tǒng),也需要從體系結(jié)構(gòu)的層面來(lái)進(jìn)一步加強(qiáng);

RISC-V為敏捷開(kāi)發(fā)提供了可能,未來(lái)可能成為開(kāi)源硬件的基礎(chǔ)。

如何走出摩爾定律困境?Keynote演講人、Facebook Research的Kim Hazelwood博士半開(kāi)玩笑說(shuō),這屆ISCA每個(gè)keynote前面都要放這張slide,表明了領(lǐng)域的困境與研究方向

Turing Lecture:體系結(jié)構(gòu)迎來(lái)新的黃金時(shí)代

在本次大會(huì)的圖靈講座(Turing Lecture)上,2017年榮獲圖靈獎(jiǎng)的John L. Hennessy和David A. Patterson首先簡(jiǎn)要回顧了計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展史,總結(jié)了目前體系結(jié)構(gòu)研究的兩大挑戰(zhàn):通用處理器性能提升的停滯和體系結(jié)構(gòu)安全的問(wèn)題。

兩位演講者提及到上世紀(jì)80年代是體系結(jié)構(gòu)發(fā)展的黃金時(shí)期,諸如RISC、超標(biāo)量處理器(superscalar)、多層緩存(multilevelcaches)、預(yù)測(cè)技術(shù)(speculation)、編譯器優(yōu)化(compileroptimization)等等體系結(jié)構(gòu)創(chuàng)新,使得計(jì)算機(jī)性能每年提升約60%。在上世紀(jì)90年代到21世紀(jì)初,由于體系結(jié)構(gòu)創(chuàng)新的放緩,計(jì)算機(jī)性能的提升主要依賴于工藝技術(shù)的進(jìn)步、更高的時(shí)鐘頻率和更大的緩存。

目前,隨著摩爾定律(Moore’s Law)和登納德縮放比例定律(Dennard Scaling)的放緩甚至停滯,單處理器核心的性能每年的提升已降為3%左右。與此同時(shí),近來(lái)的計(jì)算機(jī)漏洞幽靈(Spectre)和融毀(Meltdown),均利用了體系結(jié)構(gòu)設(shè)計(jì)的缺陷,而體系結(jié)構(gòu)的安全性問(wèn)題在近幾十年來(lái)沒(méi)有得到體系結(jié)構(gòu)研究者和設(shè)計(jì)者的足夠關(guān)注。

David Patterson(左)與John Hennessy(右)和與圖靈像合影;旁邊展示了本屆ISCA贊助商,谷歌、微軟、亞馬遜、Facebook等非傳統(tǒng)硬件廠商的存在感在增強(qiáng)

對(duì)于這些挑戰(zhàn),兩位演講者總結(jié)了體系結(jié)構(gòu)新的機(jī)遇:(1)軟硬件協(xié)同設(shè)計(jì)(Hardware/Software Co-Design)和高層專用語(yǔ)言(High-Level and Domain-Specific Languages);(2)計(jì)算機(jī)體系結(jié)構(gòu)安全性的提升;(3)開(kāi)源體系結(jié)構(gòu)設(shè)計(jì)(Free and Open Architectures and Open-Source Implementations);(4)創(chuàng)新的敏捷芯片開(kāi)發(fā)(Agile Chip Development)。

如何走出摩爾定律困境?摩爾定律領(lǐng)域的困境與研究方向詳細(xì)概述

這其中(1)強(qiáng)調(diào)了專用體系結(jié)構(gòu)(Application Specific IC/Architecture)和專用編程語(yǔ)言(Domain Specific)的開(kāi)發(fā),對(duì)于提升特定領(lǐng)域性能、功耗和開(kāi)發(fā)效率的重要性,尤其是神經(jīng)網(wǎng)絡(luò)(neural network)、圖計(jì)算(graph computation)等新興且需要高性能計(jì)算的領(lǐng)域。(2)強(qiáng)調(diào)了安全應(yīng)該和性能同樣地受到體系結(jié)構(gòu)設(shè)計(jì)研究的重視,尤其是防止信息泄露和邊信道攻擊(Side-channel attack)。(3)強(qiáng)調(diào)了體系結(jié)構(gòu)設(shè)計(jì)開(kāi)源,尤其是指令集架構(gòu)(Instruction Set Architecture)開(kāi)源的重要性。兩位演講者介紹了他們近幾年在RISC-V方面所作的工作。最后,(4)強(qiáng)調(diào)了怎樣縮短芯片開(kāi)發(fā)的時(shí)間和成本這兩個(gè)核心要素。他們認(rèn)為敏捷開(kāi)發(fā)(Agile development process)可以使得較小的研究開(kāi)發(fā)組可以反復(fù)迭代地在短時(shí)間內(nèi)廉價(jià)地開(kāi)發(fā)產(chǎn)品原型。最終的目標(biāo)是體系結(jié)構(gòu)的研究者可以利用這種開(kāi)發(fā)方式,得以流片(tape-out)驗(yàn)證有價(jià)值的設(shè)計(jì)方案。

非硬件公司存在感增強(qiáng),機(jī)器學(xué)習(xí)影響架構(gòu)和編程語(yǔ)言

在keynote方面,本次大會(huì)邀請(qǐng)了Kim Hazelwood(Facebook Research),Kunle Olukotun(斯坦福大學(xué))以及Doug Burger(Microsoft Research),分別針對(duì)Facebook的機(jī)器學(xué)習(xí)、軟件2.0(機(jī)器學(xué)習(xí)怎樣影響架構(gòu)和編程語(yǔ)言)和數(shù)據(jù)流架構(gòu)(Explicit Dataflow Execution)進(jìn)行了介紹。

值得一提,本次大會(huì)同時(shí)頒發(fā)了 Eckert-Mauchly Award,這是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域最崇高的獎(jiǎng)項(xiàng),此前JohnHennessy和David Patterson也先后獲得過(guò)這一榮譽(yù)。

今年Eckert-Mauchly Award的獲獎(jiǎng)?wù)呤侨A盛頓大學(xué)(University of Washington's Paul G. Allen School of Computer Science & Engineering)的Susan Eggers教授,基于她對(duì)同步多線程體系結(jié)構(gòu)和多核共享和一致性問(wèn)題的貢獻(xiàn)。她也是首位獲此殊榮的女性。Susan Eggers本身經(jīng)歷比較傳奇,她在本科拿到經(jīng)濟(jì)學(xué)學(xué)士后,在其他領(lǐng)域工作了十年才轉(zhuǎn)到計(jì)算機(jī)領(lǐng)域,47歲時(shí)博士畢業(yè)到華盛頓大學(xué)開(kāi)始教職生涯。

此外,Gabriel Loh本次因在三維堆疊架構(gòu)領(lǐng)域的杰出貢獻(xiàn),獲得Maurice Wilkes獎(jiǎng),Wilkes獎(jiǎng)每年一次,主要表彰推動(dòng)體系結(jié)構(gòu)工業(yè)發(fā)展的個(gè)人。Gabriel Loh于 2010年加入AMD,2013年成為AMD Fellow。

謝源課題組與Gabriel Loh(后排右數(shù)第六位)合影,后排右一是謝源教授

技術(shù)趨勢(shì)預(yù)測(cè):專用領(lǐng)域架構(gòu)全棧設(shè)計(jì)和軟硬件協(xié)同,神經(jīng)網(wǎng)絡(luò)加速器從設(shè)計(jì)到落地

1、專用領(lǐng)域語(yǔ)言 (Domain Specific Language) 與專用領(lǐng)域架構(gòu)(Domain Specific Architecture)計(jì)算模型與架構(gòu)硬件能力的抽象至關(guān)重要。

針對(duì)專用領(lǐng)域或者應(yīng)用的架構(gòu)設(shè)計(jì)仍是今年ISCA的一大焦點(diǎn),隨之而來(lái)的是專用領(lǐng)域語(yǔ)言與硬件的設(shè)計(jì)又被帶入了大眾的視野。隨著專用領(lǐng)域架構(gòu)的發(fā)展,對(duì)這些架構(gòu)進(jìn)行支持的編程語(yǔ)言也受到了廣泛的關(guān)注。這種考慮專用應(yīng)用領(lǐng)域的架構(gòu)與語(yǔ)言的軟硬件協(xié)同設(shè)計(jì)方法將會(huì)是未來(lái)專有化架構(gòu)研究的一個(gè)趨勢(shì),以及這將成為走出摩爾定律帶來(lái)的困境的一個(gè)富有前景的方案。

在圖靈獎(jiǎng)演講中,2017年圖靈獎(jiǎng)獲得者John Hennessy教授指出了,隨著摩爾定律的終結(jié),我們需要新的計(jì)算機(jī)架構(gòu)研究方法。他預(yù)言,計(jì)算機(jī)架構(gòu)團(tuán)隊(duì)縱向整合的時(shí)代即將復(fù)興,體系結(jié)構(gòu)設(shè)計(jì)者將如過(guò)去一樣,不僅需要了解底層器件,工藝,以及電路的知識(shí),也需要有著對(duì)編程語(yǔ)言以及編譯器的了解。John在總結(jié)中慷慨激昂地提到:“一切舊的東西又是新的!(Everything old is new again!)”

John Hennessy在演講中指出,隨著摩爾定律的終結(jié),我們需要新的計(jì)算機(jī)架構(gòu)研究方法。圖片來(lái)自ACM Twitter

在ISCA第二天的keynote中,來(lái)自斯坦福大學(xué)的Kunle Olukotun教授介紹了他們對(duì)于軟件2.0時(shí)代的計(jì)算機(jī)系統(tǒng)研究。他們指出了神經(jīng)網(wǎng)路應(yīng)用對(duì)計(jì)算機(jī)硬件設(shè)計(jì)帶來(lái)了極其難得的機(jī)遇,最重要的是,該應(yīng)用對(duì)于硬件的一些正確性指標(biāo)有著相對(duì)強(qiáng)大的容錯(cuò)能力,比如內(nèi)存一致性與計(jì)算精確度。同時(shí),在他的演講中,Kunle也強(qiáng)調(diào)了全棧優(yōu)化的重要性。在他們的研究中,他們提出了若干并行計(jì)算的模式,并針對(duì)這些專用模式進(jìn)行專用領(lǐng)域硬件的設(shè)計(jì),極大提升了在專用領(lǐng)域硬件的性能,以及通過(guò)開(kāi)發(fā)專用領(lǐng)域語(yǔ)言減輕了軟件開(kāi)發(fā)者在新興架構(gòu)上開(kāi)發(fā)高性能程序的壓力。

專用領(lǐng)域帶來(lái)了新的機(jī)會(huì),這些新的機(jī)會(huì)幫助我們?cè)O(shè)計(jì)新硬件,也讓軟件開(kāi)發(fā)變得更加高效。從這些研究中,我們也看到了軟硬針對(duì)專用協(xié)同設(shè)計(jì)的未來(lái)!

2、神經(jīng)網(wǎng)絡(luò)加速器從設(shè)計(jì)到落地:加速器落地真實(shí)物理系統(tǒng)及全系統(tǒng)優(yōu)化

縱觀近兩年神經(jīng)網(wǎng)絡(luò)加速所采用的模型壓縮算法,主要包括對(duì)于神經(jīng)元狀態(tài)和權(quán)重連接參數(shù)的稀疏化和低比特量化,以及加速器硬件優(yōu)化策略,主要包括處理單元數(shù)據(jù)復(fù)用、存儲(chǔ)計(jì)算一體化、存儲(chǔ)器優(yōu)化等,對(duì)加速器性的提升幾乎已經(jīng)做到了極致的優(yōu)化。從最初的純硬件優(yōu)化到如今的算法和硬件協(xié)同優(yōu)化,使得神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化空間逐漸收縮,基于現(xiàn)有方法和技術(shù)很難再實(shí)現(xiàn)大幅度的性能改善。在這樣的情況下,未來(lái)會(huì)逐漸發(fā)生從如何設(shè)計(jì)加速器到如何使用加速器的轉(zhuǎn)變,從設(shè)計(jì)加速器本身到設(shè)計(jì)全系統(tǒng),并最終落地現(xiàn)實(shí)應(yīng)用場(chǎng)景。

一方面,需要盡快構(gòu)建神經(jīng)網(wǎng)絡(luò)加速器的編程抽象模型、編程語(yǔ)言和編譯器,從而促進(jìn)加速器的模塊化、標(biāo)準(zhǔn)化和易用性;另一方面,需要根據(jù)不同應(yīng)用場(chǎng)景,選擇對(duì)應(yīng)特性的加速器進(jìn)行真實(shí)物理系統(tǒng)設(shè)計(jì)、優(yōu)化和實(shí)現(xiàn),從而促進(jìn)加速器落地于現(xiàn)實(shí)生活。正如兩位圖靈獎(jiǎng)獲得者JohnL. Hennessy and David A. Patterson在演講中提到的兩大熱點(diǎn):專用域架構(gòu)(Domain-specific Architecture)和專用域語(yǔ)言(Domain-specific Language),接下來(lái)學(xué)術(shù)界和產(chǎn)業(yè)界會(huì)更加關(guān)注上層語(yǔ)言的設(shè)計(jì)和開(kāi)發(fā)。

同時(shí),在移動(dòng)平臺(tái)分會(huì)場(chǎng),來(lái)自康奈爾大學(xué)的Mark Buckler和來(lái)自羅徹斯特大學(xué)的Yuhao Zhu在演講中均展示了如何把神經(jīng)網(wǎng)絡(luò)加速器作為一個(gè)IP模塊進(jìn)行移動(dòng)視覺(jué)系統(tǒng)設(shè)計(jì)和優(yōu)化。由此可見(jiàn),神經(jīng)網(wǎng)絡(luò)加速器的標(biāo)準(zhǔn)化或開(kāi)源化,對(duì)于加速器的推廣和應(yīng)用至關(guān)重要。

3、安全性受到關(guān)注。安全領(lǐng)域的研究方法除軟件,系統(tǒng),也需要從體系結(jié)構(gòu)的層面來(lái)進(jìn)一步加強(qiáng)

針對(duì)最近的體系結(jié)構(gòu)安全性問(wèn)題(Meltdown& Spectre Design Flaws),本次大會(huì)的專家討論(panel discussion)邀請(qǐng)了5位專家和教授:Mark Hill作為主持人,Paul Kocher, Ruby B. Lee, Simha Sethumadhavan和Timothy Sherwood作為嘉賓對(duì)安全問(wèn)題展開(kāi)了討論。Paul指出了現(xiàn)有系統(tǒng)設(shè)計(jì)主題思想是面向性能,而缺乏安全性分析和設(shè)計(jì)。雖然性能的量化指標(biāo)豐富且成熟,但安全性指標(biāo)的量化體系并沒(méi)有建立,比如緩存行為,預(yù)測(cè)器,debug模式,以及功耗,內(nèi)部傳感器等等對(duì)安全性的影響。由于量化分析方法的缺乏,加上微體系結(jié)構(gòu)設(shè)計(jì)本身對(duì)軟件開(kāi)發(fā)者不開(kāi)放,導(dǎo)致系統(tǒng)構(gòu)建時(shí)存在一些錯(cuò)誤的安全性假設(shè),也無(wú)法做性能和安全性的聯(lián)合優(yōu)化和管理。Ruby Lee,Samira和Tim都認(rèn)為體系結(jié)構(gòu)社區(qū)需要對(duì)安全性投入更多關(guān)注,設(shè)計(jì)安全性能感知的計(jì)算機(jī)體系結(jié)構(gòu)十分重要。

4、RISC-V為敏捷開(kāi)發(fā)提供了可能,未來(lái)可能成為開(kāi)源硬件的基礎(chǔ)

從兩位圖靈獎(jiǎng)得主的演講當(dāng)中,我們可以看到RISC-V作為開(kāi)源精簡(jiǎn)指令集對(duì)專用領(lǐng)域架構(gòu)的重要性。隨著數(shù)據(jù)中心定制化硬件的普及,例如谷歌TPU和微軟Brainwave,硬件架構(gòu)師不能僅模擬單節(jié)點(diǎn)而把問(wèn)題留給流片后的測(cè)試,也需要模擬定制化部分。然后缺少高效和可擴(kuò)展的模擬環(huán)境阻礙著新一代Warehouse-Scale Computers (WSCs) 的發(fā)展。

來(lái)自加州大學(xué)伯克利Krste Asanovi教授團(tuán)隊(duì)的FireSim填補(bǔ)了這一項(xiàng)空白;也正是主推RISC-V的團(tuán)隊(duì)。通過(guò)利用云端FPGA,F(xiàn)ireSim結(jié)合基于RISC-V的Rocket Chip和cycle-accurateC++ switch模型可以模擬多達(dá)4096個(gè)核心和16TB存儲(chǔ)器。

同樣是來(lái)自伯克利的另一項(xiàng)工作,針對(duì)GarbageCollection設(shè)計(jì)了硬件加速器,并且集成到RocketChip 當(dāng)中。整個(gè)系統(tǒng)從JavaVM到Linux再到FPGA全面地展示了端到端模擬能力。同時(shí),在關(guān)于RISC-V對(duì)計(jì)算機(jī)體系結(jié)構(gòu)研究的workshop(CARRV)當(dāng)中,基于RISC-V 的工具鏈在包括模擬器,加密,和數(shù)字信號(hào)處理中都影響著學(xué)界和業(yè)界。

大會(huì)概況:28%的論文有關(guān)神經(jīng)網(wǎng)絡(luò)加速器,清華大學(xué)入選一篇

1、神經(jīng)網(wǎng)絡(luò)加速依舊火熱

神經(jīng)網(wǎng)絡(luò)加速器依舊持續(xù)火熱,除兩個(gè)機(jī)器學(xué)習(xí)系統(tǒng)分會(huì)場(chǎng)外,還分布于云數(shù)據(jù)中心、新型應(yīng)用加速、新型計(jì)算范式、內(nèi)存持久性、新型存儲(chǔ)器、移動(dòng)平臺(tái)等各大分會(huì)場(chǎng)。

神經(jīng)網(wǎng)絡(luò)加速器共計(jì)接收18篇論文(28%),從研究?jī)?nèi)容可分為:DNN推理加速(10篇)、移動(dòng)系統(tǒng)(3篇)、脈沖神經(jīng)網(wǎng)絡(luò)(2篇)、DNN訓(xùn)練加速(1篇)、GAN加速(1篇)、編程指令集架構(gòu)(1篇)。

論文主要來(lái)自于美國(guó),包括微軟、伊利諾伊大學(xué)香檳分校(UIUC)、威斯康星大學(xué)、密歇根大學(xué)、康奈爾大學(xué)、羅徹斯特大學(xué)、喬治亞理工學(xué)院、加州大學(xué)圣地亞哥分校(UCSD)、加州大學(xué)伯克利分校(UCB)、佛羅里達(dá)大學(xué)、ARM、高通(Qualcomm)、英偉達(dá)(NVIDIA)等,4篇來(lái)自于亞洲:清華大學(xué)、首爾國(guó)立大學(xué)(SNU)和新加坡國(guó)立大學(xué)(NUS),2篇來(lái)自于歐洲加泰羅尼亞理工大學(xué)(UPC)。

本屆大會(huì)對(duì)于DNN推理階段的加速優(yōu)化呈現(xiàn)多樣化,以DNN推理加速的10篇論文為例,3篇針對(duì)稀疏網(wǎng)絡(luò)(解決自動(dòng)語(yǔ)音識(shí)別系統(tǒng)中由于網(wǎng)絡(luò)裁剪導(dǎo)致的分類置信度下降和執(zhí)行時(shí)間增長(zhǎng)的問(wèn)題;通過(guò)預(yù)測(cè)零狀態(tài)輸出神經(jīng)元從而去除與其相關(guān)的冗余計(jì)算)、3篇針對(duì)低比特量化網(wǎng)絡(luò)(利用數(shù)據(jù)量化后狀態(tài)有限的特性從而共享重復(fù)的神經(jīng)元激活狀態(tài)和權(quán)重參數(shù)狀態(tài),達(dá)到減小計(jì)算的目的;設(shè)計(jì)支持量化比特?cái)?shù)可變的加速器方案,提高對(duì)量化網(wǎng)絡(luò)支持的通用性)、2篇進(jìn)行SRAM緩存計(jì)算(Processing in SRAM)、1篇進(jìn)行eDRAM刷新優(yōu)化(對(duì)于生命周期較短的數(shù)據(jù)不進(jìn)行刷新,從而極大降低功耗)、1篇面向FPGA數(shù)據(jù)中心(提升數(shù)據(jù)中心對(duì)于用戶推理需求的響應(yīng)時(shí)間)。

2、機(jī)器學(xué)習(xí)與系統(tǒng)得到深入探討

機(jī)器學(xué)習(xí)與系統(tǒng)設(shè)計(jì)之間的關(guān)系也在此次大會(huì)中進(jìn)行了深入的探討,主要包括兩個(gè)方向:1)為機(jī)器學(xué)習(xí)應(yīng)用構(gòu)建加速系統(tǒng);2)使用機(jī)器學(xué)習(xí)方法加速系統(tǒng)設(shè)計(jì)。大會(huì)第一天keynote由Kim Hazelwood介紹Facebook在第一個(gè)技術(shù)方向的嘗試和探索。Kim認(rèn)為除計(jì)算瓶頸外,存儲(chǔ)瓶頸和軟件瓶頸也是系統(tǒng)構(gòu)建時(shí)要考慮的關(guān)鍵因素。AIDArchworkshop討論了第二個(gè)技術(shù)方向。DanielSchanwz 教授和Cliff Young介紹了體系結(jié)構(gòu)領(lǐng)域中使用機(jī)器學(xué)習(xí)方法來(lái)優(yōu)化系統(tǒng)設(shè)計(jì),以及軟硬件聯(lián)合優(yōu)化的重要性和可能性。

3、基礎(chǔ)框架和模擬器

DNN加速器模擬:來(lái)自Gerogia Tech和NVIDIA Research的團(tuán)隊(duì)在這次ISCA tutorial公布了兩個(gè)支持快速高效DNN加速器設(shè)計(jì)的工具:MAESTRO和MAERI。MAESTRO是針對(duì)不同卷積dataflow的分析工具。用戶可以通過(guò)改變loop-ordering,loop unrolling, spatial tiling和temporal tiling來(lái)模擬不同的dataflow,并且能在用戶定義的處理單元數(shù)目和緩存大小下估計(jì)運(yùn)行時(shí)間和能耗。參數(shù)化和模塊化的DNN加速器生成器MAERI可以輸出RTL,并且通過(guò)ASIC或者FPGA設(shè)計(jì)流程估計(jì)性能功耗和面積。目前MAERI支持卷積,LSTM,pooling,和全連接層,已經(jīng)完整的DNN模型運(yùn)行。

GPU模型。AMD Research在gem5中擴(kuò)展了APU模型。該模型使用基于GCN gen3ISA 的GPU時(shí)序并且支持開(kāi)源Radeon OpenCompute Platform (ROCm)。用戶可以在gem5APU 模擬器上運(yùn)行C++,OpenMP,HIP,和OpenCL編寫(xiě)的應(yīng)用,包括傳統(tǒng)的GPU workloads和機(jī)器學(xué)習(xí)應(yīng)用。由于APU中GPU直接與主存交互,針對(duì)GPU的訪存優(yōu)化得以更方便在gem5中驗(yàn)證。除此之外,來(lái)自康奈爾大學(xué)的研究人員在workshop中展示了在gem5中基于RISC-V的多核心模擬器。

4、其他方向

對(duì)于編程語(yǔ)言的動(dòng)態(tài)功能以及系統(tǒng)進(jìn)行從體系結(jié)構(gòu)層面進(jìn)行支持,在今年ISCA的論文中受到了廣泛的關(guān)注。在編程語(yǔ)言的動(dòng)態(tài)功能支持上,來(lái)自UCB的Martin Maas等人展示了針對(duì)Java內(nèi)存管理中垃圾回收的硬件優(yōu)化。對(duì)于系統(tǒng)層面的支持,本次ISCA錄用文章的關(guān)注點(diǎn)仍然在內(nèi)存,包括內(nèi)存模型,虛擬內(nèi)存,內(nèi)存一致性,內(nèi)存持久性(Memory Persistence)。

除此之外,新型互連架構(gòu)也受到了一定程度的關(guān)注,這些互連架構(gòu)有一些關(guān)注于芯片間的互連,另一些則關(guān)注分布式系統(tǒng)中的網(wǎng)絡(luò)互聯(lián)。最后,關(guān)于資源分配,一個(gè)傳統(tǒng)操作系統(tǒng)最關(guān)鍵的任務(wù)之一,來(lái)自UIUC的Josep Torrellas教授等人提出了基于健壯控制理論(Robust Control Theory)的分層資源控制方法,極大提升資源分配的效率。

綜上所述,在今年ISCA中,從體系結(jié)構(gòu)對(duì)于操作系統(tǒng)以及編程語(yǔ)言的支持,尤其是內(nèi)存系統(tǒng)的支持,仍然有廣泛的關(guān)注。這其中的許多研究,都圍繞著基于加速器的異構(gòu)系統(tǒng)以及基于持久性內(nèi)存的系統(tǒng)所帶來(lái)的問(wèn)題。我們期待這些研究對(duì)于實(shí)際的新興架構(gòu)部署能提供強(qiáng)有力幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:圖靈獎(jiǎng)得主展望新黃金時(shí)代,拿什么拯救摩爾定律?

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    擊碎摩爾定律!英偉達(dá)和AMD將一年一款新品,均提及HBM和先進(jìn)封裝

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)摩爾定律是由英特爾創(chuàng)始人之一戈登·摩爾提出的經(jīng)驗(yàn)規(guī)律,描述了集成電路上的晶體管數(shù)量和性能隨時(shí)間的增長(zhǎng)趨勢(shì)。根據(jù)摩爾定律,集成電路上可容納的晶體管數(shù)目約每隔18個(gè)月便會(huì)
    的頭像 發(fā)表于 06-04 00:06 ?3948次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達(dá)和AMD將一年一款新品,均提及HBM和先進(jìn)封裝

    高算力AI芯片主張“超越摩爾”,Chiplet與先進(jìn)封裝技術(shù)迎百家爭(zhēng)鳴時(shí)代

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)英特爾CEO基辛格此前表示,摩爾定律并沒(méi)有失效,只是變慢了,節(jié)奏周期正在放緩至三年。當(dāng)然,摩爾定律不僅是周期從18個(gè)月變?yōu)榱?年,且開(kāi)發(fā)先進(jìn)制程成本高昂,經(jīng)濟(jì)效益也變得
    的頭像 發(fā)表于 09-04 01:16 ?2988次閱讀
    高算力AI芯片主張“超越<b class='flag-5'>摩爾</b>”,Chiplet與先進(jìn)封裝技術(shù)迎百家爭(zhēng)鳴時(shí)代

    “自我實(shí)現(xiàn)的預(yù)言”摩爾定律,如何繼續(xù)引領(lǐng)創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應(yīng)邀在《電子》雜志上發(fā)表了一篇四頁(yè)短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?231次閱讀

    封裝技術(shù)會(huì)成為摩爾定律的未來(lái)嗎?

    你可聽(tīng)說(shuō)過(guò)摩爾定律?在半導(dǎo)體這一領(lǐng)域,摩爾定律幾乎成了預(yù)測(cè)未來(lái)的神話。這條定律,最早是由英特爾聯(lián)合創(chuàng)始人戈登·摩爾于1965年提出,簡(jiǎn)單地說(shuō)
    的頭像 發(fā)表于 04-19 13:55 ?292次閱讀
    封裝技術(shù)會(huì)成為<b class='flag-5'>摩爾定律</b>的未來(lái)嗎?

    功能密度定律是否能替代摩爾定律?摩爾定律和功能密度定律比較

    眾所周知,隨著IC工藝的特征尺寸向5nm、3nm邁進(jìn),摩爾定律已經(jīng)要走到盡頭了,那么,有什么定律能接替摩爾定律呢?
    的頭像 發(fā)表于 02-21 09:46 ?611次閱讀
    功能密度<b class='flag-5'>定律</b>是否能替代<b class='flag-5'>摩爾定律</b>?<b class='flag-5'>摩爾定律</b>和功能密度<b class='flag-5'>定律</b>比較

    半導(dǎo)體行業(yè)能否走出低谷,中國(guó)影響幾何?

    英特爾和臺(tái)積電都在技術(shù)上投入資金。三星和其他內(nèi)存制造商必須跟上技術(shù)節(jié)點(diǎn)的轉(zhuǎn)變,即使同時(shí)保持產(chǎn)能遠(yuǎn)離市場(chǎng)。他們需要跟上技術(shù)的步伐,以在摩爾定律的基礎(chǔ)上保持競(jìng)爭(zhēng)力,摩爾定律推動(dòng)了內(nèi)存業(yè)務(wù)的基本成本。
    的頭像 發(fā)表于 01-29 11:05 ?737次閱讀

    摩爾定律的終結(jié):芯片產(chǎn)業(yè)的下一個(gè)勝者法則是什么?

    在動(dòng)態(tài)的半導(dǎo)體技術(shù)領(lǐng)域,圍繞摩爾定律的持續(xù)討論經(jīng)歷了顯著的演變,其中最突出的是 MonolithIC 3D 首席執(zhí)行官Zvi Or-Bach于2014 年的主張。
    的頭像 發(fā)表于 01-25 14:45 ?1015次閱讀
    <b class='flag-5'>摩爾定律</b>的終結(jié):芯片產(chǎn)業(yè)的下一個(gè)勝者法則是什么?

    中國(guó)團(tuán)隊(duì)公開(kāi)“Big Chip”架構(gòu)能終結(jié)摩爾定律?

    摩爾定律的終結(jié)——真正的摩爾定律,即晶體管隨著工藝的每次縮小而變得更便宜、更快——正在讓芯片制造商瘋狂。
    的頭像 發(fā)表于 01-09 10:16 ?754次閱讀
    中國(guó)團(tuán)隊(duì)公開(kāi)“Big Chip”架構(gòu)能終結(jié)<b class='flag-5'>摩爾定律</b>?

    英特爾CEO基辛格:摩爾定律放緩,仍能制造萬(wàn)億晶體

    帕特·基辛格進(jìn)一步預(yù)測(cè),盡管摩爾定律顯著放緩,到2030年英特爾依然可以生產(chǎn)出包含1萬(wàn)億個(gè)晶體管的芯片。這將主要依靠新 RibbonFET晶體管、PowerVIA電源傳輸、下一代工藝節(jié)點(diǎn)以及3D芯片堆疊等技術(shù)實(shí)現(xiàn)。目前單個(gè)封裝的最大芯片含有約1000億個(gè)晶體管。
    的頭像 發(fā)表于 12-26 15:07 ?615次閱讀

    英特爾CEO基辛格:摩爾定律仍具生命力,且仍在推動(dòng)創(chuàng)新

    摩爾定律概念最早由英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1970年提出,明確指出芯片晶體管數(shù)量每?jī)赡攴环5靡嬗谛鹿?jié)點(diǎn)密度提升及大規(guī)模生產(chǎn)芯片的能力。
    的頭像 發(fā)表于 12-25 14:54 ?560次閱讀

    摩爾定律時(shí)代,Chiplet落地進(jìn)展和重點(diǎn)企業(yè)布局

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)幾年前,全球半導(dǎo)體產(chǎn)業(yè)的重心還是如何延續(xù)摩爾定律,在材料和設(shè)備端進(jìn)行了大量的創(chuàng)新。然而,受限于工藝、制程和材料的瓶頸,當(dāng)前摩爾定律發(fā)展出現(xiàn)疲態(tài),產(chǎn)業(yè)的重點(diǎn)開(kāi)始逐步轉(zhuǎn)移到
    的頭像 發(fā)表于 12-21 00:30 ?1446次閱讀

    應(yīng)對(duì)傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法

    應(yīng)對(duì)傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法
    的頭像 發(fā)表于 12-05 15:32 ?523次閱讀
    應(yīng)對(duì)傳統(tǒng)<b class='flag-5'>摩爾定律</b>微縮挑戰(zhàn)需要芯片布線和集成的新方法

    奇異摩爾與潤(rùn)欣科技加深戰(zhàn)略合作開(kāi)創(chuàng)Chiplet及互聯(lián)芯粒未來(lái)

    模式的創(chuàng)新,就多種 Chiplet 互聯(lián)產(chǎn)品和互聯(lián)芯粒的應(yīng)用領(lǐng)域拓展合作空間。 在摩爾定律持續(xù)放緩與最大化計(jì)算資源需求的矛盾下,Chiplet 已成為當(dāng)今克服摩爾定律與硅物理極限挑戰(zhàn)的核心戰(zhàn)術(shù)。Chiplet 作為一種互連技術(shù),
    的頭像 發(fā)表于 11-30 11:06 ?3532次閱讀

    摩爾定律失效#計(jì)算機(jī)

    計(jì)算機(jī)軟件網(wǎng)絡(luò)
    未來(lái)加油dz
    發(fā)布于 :2023年11月15日 18:12:55

    奇異摩爾??|:Chiplet和網(wǎng)絡(luò)加速 互聯(lián)時(shí)代兩大關(guān)鍵技術(shù)

    為突破算力局限的新生技術(shù),在短短幾年時(shí)間內(nèi),迅速成長(zhǎng)為全球芯片巨頭的主流方案和行業(yè)公認(rèn)的“摩爾定律拯救者”,其在商業(yè)領(lǐng)域的廣泛應(yīng)用又引發(fā)了從片內(nèi)、片間到集群間的互聯(lián)技術(shù)變遷。自此,半導(dǎo)體行業(yè)正式走進(jìn)互聯(lián)時(shí)代。 2023 年
    的頭像 發(fā)表于 11-14 09:26 ?1168次閱讀
    奇異<b class='flag-5'>摩爾</b>祝俊東:Chiplet和網(wǎng)絡(luò)加速 互聯(lián)時(shí)代兩大關(guān)鍵技術(shù)