0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ACCEL光電芯片,性能超GPU千倍,新一代計(jì)算架構(gòu)將更早來(lái)臨

Robot Vision ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李寧遠(yuǎn) ? 2023-11-05 07:07 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))自1965年戈登摩爾提出摩爾定律以后,半導(dǎo)體行業(yè)在摩爾定律上已經(jīng)繁榮發(fā)展了半個(gè)多世紀(jì)。芯片,已經(jīng)成為時(shí)代發(fā)展的重要引擎。但隨著晶體管尺寸逐漸逼近物理極限,近年來(lái)摩爾定律發(fā)展已放緩,甚至面臨失效無(wú)法延續(xù),需要建立新的芯片秩序。
而且在現(xiàn)在的人工智能時(shí)代,算力是無(wú)法替代的先進(jìn)生產(chǎn)力,是人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等先進(jìn)技術(shù)落地應(yīng)用的基礎(chǔ)支撐,而國(guó)內(nèi)正處在高端算力芯片供應(yīng)鏈被封鎖的形勢(shì)。如何繞開專利、技術(shù)被封鎖的束縛,找出一條新的道路來(lái)也是至關(guān)重要。
近日,清華大學(xué)團(tuán)隊(duì)在超高性能計(jì)算芯片領(lǐng)域取得了令人矚目的關(guān)鍵成果,他們成功研發(fā)的ACCEL光電計(jì)算芯片,相關(guān)成果以《面向高速視覺任務(wù)的純模擬光電計(jì)算芯片》為題發(fā)表在Nature上。
與現(xiàn)有高端GPU相比,實(shí)現(xiàn)了算力提升三千余倍,能效提升四百萬(wàn)余倍的表現(xiàn),ACCEL光電計(jì)算芯片為超高性能芯片的研發(fā)開辟了全新的路徑。
ACCEL架構(gòu)光電計(jì)算實(shí)現(xiàn)高速視覺處理性能飛躍
現(xiàn)在我們使用的各種設(shè)備和系統(tǒng),絕大多數(shù)通過晶體管以電信號(hào)來(lái)進(jìn)行計(jì)算,以現(xiàn)在市面上用于人工智能算力芯片內(nèi)集成的晶體管數(shù)量已經(jīng)以百億、千億來(lái)算。這些晶體管操縱電流實(shí)現(xiàn)超大規(guī)模的計(jì)算。
人工智能算力正在崛起成為剛需,而摩爾定律正在衰落,尋找新興技術(shù)革新硬件計(jì)算是目前前沿科技的一大技術(shù)熱點(diǎn)。量子計(jì)算、神經(jīng)形態(tài)芯片、光子計(jì)算等都是有可能實(shí)現(xiàn)計(jì)算性能飛躍的技術(shù)路線,光子計(jì)算是其中有力的競(jìng)爭(zhēng)者,近期ACCEL光電計(jì)算芯片的突破也印證了這一技術(shù)路線的可行性。
面向高速視覺任務(wù)的純模擬光電計(jì)算芯片基于光電深度融合計(jì)算框架,將光芯片與電芯片結(jié)合,在一枚芯片上突破大規(guī)模計(jì)算單元集成、高效非線性、高速光電接口三個(gè)國(guó)際難題,由清華大學(xué)自動(dòng)化系(戴瓊海院士、吳嘉敏助理教授)與電子工程系(方璐副教授、喬飛副研究員)聯(lián)合攻克。
不同于傳統(tǒng)計(jì)算,光子計(jì)算不是通過將電流表示成0和1來(lái)編碼和操作數(shù)據(jù),而是利用光的物理特性來(lái)進(jìn)行計(jì)算。光子計(jì)算使用光,這使得它更快、更有效、更緊湊。光子計(jì)算的確能夠更快、更節(jié)能地處理視覺數(shù)據(jù)。
然而,由于復(fù)雜的光學(xué)非線性、用于下游數(shù)字處理的模數(shù)轉(zhuǎn)換器ADC的大功耗以及易受噪聲和系統(tǒng)誤差的影響,部署上挑戰(zhàn)很大。
因此,清華大學(xué)團(tuán)隊(duì)提出了一種結(jié)合電子和光計(jì)算(ACCEL)的全模擬芯片架構(gòu),將衍射光學(xué)模擬計(jì)算(OAC)和電子模擬計(jì)算(EAC)融合在一個(gè)芯片中,具有可擴(kuò)展性、非線性和靈活性。根據(jù)論文數(shù)據(jù),其系統(tǒng)能效為74.8Peta-OPS/W,計(jì)算速度為4.6Peta-OPS,而且計(jì)算的99%都由光學(xué)部分實(shí)現(xiàn)。
不論是系統(tǒng)能效還是計(jì)算速度,和現(xiàn)在最先進(jìn)的計(jì)算處理相比,ACCEL都有著數(shù)量級(jí)上絕對(duì)的領(lǐng)先。
具體來(lái)說,ACCEL的系統(tǒng)級(jí)算力穩(wěn)定達(dá)到現(xiàn)有高性能芯片的數(shù)千倍,同時(shí)系統(tǒng)級(jí)能效較現(xiàn)有的高性能 GPU、TPU、光計(jì)算和模擬電計(jì)算架構(gòu),提升了兩千到數(shù)百萬(wàn)倍不等。
對(duì)于視覺數(shù)據(jù)來(lái)說,ACCEL無(wú)疑讓處理性能實(shí)現(xiàn)了飛躍,也表明了“掙脫”摩爾定律的全新計(jì)算架構(gòu)的可行性。
全新顛覆性計(jì)算架構(gòu),助力***領(lǐng)域彎道超車
ACCEL架構(gòu)光芯片與電芯片的融合性能的大幅提升已經(jīng)被證實(shí),而且該芯片光學(xué)部分的加工最小線寬僅采用百納米級(jí),而電路部分僅采用180nm CMOS工藝。如果采用更先進(jìn)的工藝技術(shù),ACCEL能進(jìn)一步大幅降低更高時(shí)鐘頻率下運(yùn)行的控制單元功耗。
成熟的工藝卻實(shí)現(xiàn)了超越先進(jìn)制程GPU的性能,未來(lái)光子計(jì)算的霸權(quán)或許不是說說而已。
根據(jù)清華團(tuán)隊(duì)的說法,如果將OAC層數(shù)進(jìn)一步提高,ACCEL的性能將進(jìn)一步提高,實(shí)現(xiàn)靈敏度更高的光電二極管陣列并行輸出。增加SRAM位數(shù)將進(jìn)一步拓展ACCEL可分類的視覺類別數(shù)量。其未來(lái)的發(fā)展還有很大的提升空間。
更高算力和更優(yōu)秀的能耗比只是ACCEL兩個(gè)最直觀的特點(diǎn),在論文中,還披露了大量技術(shù)細(xì)節(jié)。
ACCEL將衍射光學(xué)計(jì)算作為光學(xué)編碼器進(jìn)行特征提取后,誘導(dǎo)光電流直接用于進(jìn)一步計(jì)算,無(wú)需模數(shù)轉(zhuǎn)換器。在同一任務(wù)不同類型的數(shù)字神經(jīng)網(wǎng)絡(luò)的端到端延遲和能耗對(duì)比中,ACCEL實(shí)現(xiàn)了每幀72 ns的超低計(jì)算延遲和每幀4.38 nJ的能耗,遠(yuǎn)小于NVIDIA A100的每幀0.26 ms延遲和每幀18.5 mJ的能耗。
論采用哪種方式計(jì)算操作,在實(shí)際應(yīng)用中實(shí)現(xiàn)相同精度時(shí),ACCEL與先進(jìn)GPU上的數(shù)字神經(jīng)網(wǎng)絡(luò)相比,全模擬的ACCEL都能將系統(tǒng)延遲和能耗降低了幾個(gè)數(shù)量級(jí)。
可以說ACCEL的全新計(jì)算架構(gòu),極具顛覆性,繞過了模擬數(shù)字轉(zhuǎn)換器速度、精度與功耗相互制約的物理瓶頸,充分利用了光電技術(shù)的優(yōu)勢(shì),芯片實(shí)現(xiàn)了計(jì)算效率和能耗的極致優(yōu)化。大量的實(shí)驗(yàn)數(shù)據(jù)對(duì)比也打消了人們對(duì)光子計(jì)算算力“有效性”的顧慮。
雖然這一技術(shù)目前還只是停留在實(shí)驗(yàn)室階段,但從實(shí)際應(yīng)用價(jià)值來(lái)看,這一成果對(duì)于推動(dòng)芯片技術(shù)進(jìn)步、降低能耗和提高計(jì)算效率具有重要意義。在國(guó)內(nèi)先進(jìn)制程面臨制約的情況下,清華大學(xué)團(tuán)隊(duì)在顛覆性計(jì)算架構(gòu)取得的成果給我國(guó)高性能芯片研發(fā)開辟了一條全新的路徑,是打破芯片專利、技術(shù)封鎖的一個(gè)方向。
光電芯片在量產(chǎn)后,也足夠顛覆現(xiàn)在的半導(dǎo)體格局,也將在未來(lái)實(shí)際應(yīng)用落地后推動(dòng)人工智能等領(lǐng)域的創(chuàng)新與發(fā)展。
小結(jié)
目前,該團(tuán)隊(duì)正在研究規(guī)模更大、算力更強(qiáng)的模擬域光電融合系統(tǒng),這需要在算法層面和硬件層面,開展更高層次的聯(lián)合設(shè)計(jì)優(yōu)化。目標(biāo)應(yīng)用也拓展至和高速處理相關(guān)的領(lǐng)域,如時(shí)延降低四個(gè)數(shù)量級(jí)的超高速圖像計(jì)算、自動(dòng)駕駛、野外監(jiān)測(cè)、物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)等等。
采用全新原理研發(fā)出計(jì)算芯片需要越過很多難關(guān),不可能一蹴而就,但ACCEL的出現(xiàn)也意味著新一代計(jì)算架構(gòu)時(shí)代的來(lái)臨可能會(huì)比料想中的更早。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 光電
    +關(guān)注

    關(guān)注

    8

    文章

    714

    瀏覽量

    81541
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4592

    瀏覽量

    128169
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    力量關(guān)注算力芯片的發(fā)展,希望我們的國(guó)家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能算力芯片。 內(nèi)容簡(jiǎn)介: 本書介紹了超級(jí)計(jì)算機(jī)算力和AI算力的異同,從CPU流水線開始,描述主要的眾核處理器
    發(fā)表于 09-02 10:09

    IaaS+on+DPU(IoD)+下一代性能算力底座技術(shù)白皮書

    ,在其上掛載了各種計(jì)算、存儲(chǔ)資源的節(jié)點(diǎn),對(duì)于系統(tǒng)的資源彈性、運(yùn)行效率、性能都大有益處。但是這種使用方式的變化,需要對(duì)現(xiàn)有云計(jì)算架構(gòu)進(jìn)行定程
    發(fā)表于 07-24 15:32

    美光科技發(fā)布新一代GDDR7顯存

    在近日舉行的臺(tái)北國(guó)際電腦展上,美國(guó)存儲(chǔ)芯片巨頭美光科技正式發(fā)布了其新一代GDDR7顯存。這款新型GPU顯卡內(nèi)存基于美光的1βDRAM架構(gòu),
    的頭像 發(fā)表于 06-06 09:24 ?319次閱讀

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    2024年3月19日,[英偉達(dá)]CEO[黃仁勛]在GTC大會(huì)上公布了新一代AI芯片架構(gòu)BLACKWELL,并推出基于該架構(gòu)的超級(jí)芯片GB20
    發(fā)表于 05-13 17:16

    英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

    近日,英偉達(dá)首席執(zhí)行官黃仁勛在GTC 2024會(huì)議上發(fā)表主題演講,重磅推出全新AI芯片架構(gòu)Blackwell GPU。這創(chuàng)新技術(shù)的首款芯片
    的頭像 發(fā)表于 03-26 11:19 ?706次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或取代GPU

    ,并在運(yùn)算速度和吞吐量方面提供了更高的性能。它們的使用壽命也更長(zhǎng),大約是 GPU 的 2-5 ,并且對(duì)惡劣環(huán)境和其它特殊環(huán)境因素有更強(qiáng)的適應(yīng)性。 有些公司已經(jīng)在他們的人工智能產(chǎn)品中
    發(fā)表于 03-21 15:19

    英偉達(dá)最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30!

    黃仁勛說:"我們已經(jīng)來(lái)到了個(gè)臨界點(diǎn),因此需要種新的計(jì)算方式來(lái)加速整個(gè)行業(yè)的發(fā)展效率。那么英偉達(dá)能夠做什么?當(dāng)然,答案就是——更大的芯片?!苯又ミ_(dá)
    的頭像 發(fā)表于 03-19 13:39 ?1462次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預(yù)計(jì)會(huì)在今年第二季度發(fā)布Blackwell架構(gòu)新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1097次閱讀
    NVIDIA將在今年第二季度發(fā)布Blackwell<b class='flag-5'>架構(gòu)</b>的<b class='flag-5'>新一代</b><b class='flag-5'>GPU</b>加速器“B100”

    光電智能計(jì)算架構(gòu)芯片研究

    當(dāng)前,人工智能技術(shù)的復(fù)興正引領(lǐng)著新一代信息技術(shù)迅猛發(fā)展,由電子驅(qū)動(dòng)的計(jì)算處理器在過去十年中發(fā)生了巨大的變化,從通用中央處理器(CPU)到定制計(jì)算平臺(tái),例如GPU、FPGA和ASIC,以
    的頭像 發(fā)表于 01-08 09:13 ?657次閱讀
    <b class='flag-5'>光電</b>智能<b class='flag-5'>計(jì)算</b><b class='flag-5'>架構(gòu)</b>和<b class='flag-5'>芯片</b>研究

    揭秘GPU: 高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

    計(jì)算領(lǐng)域,GPU(圖形處理單元)直是性能飛躍的代表。眾所周知,高端GPU的設(shè)計(jì)充滿了挑戰(zhàn)。GPU
    的頭像 發(fā)表于 12-21 08:28 ?735次閱讀
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>設(shè)計(jì)的挑戰(zhàn)

    中國(guó)研制出全球首個(gè)全模擬光電智能計(jì)算芯片

    經(jīng)長(zhǎng)期聯(lián)合攻關(guān),清華大學(xué)研究團(tuán)隊(duì)突破傳統(tǒng)芯片的物理瓶頸,創(chuàng)造性提出光電融合的全新計(jì)算框架,并研制出國(guó)際首個(gè)全模擬光電智能計(jì)算
    的頭像 發(fā)表于 12-04 17:39 ?1002次閱讀

    清華研制出首個(gè)全模擬光電智能計(jì)算芯片ACCEL

    是已完成了原理樣片。 清華大學(xué)研究團(tuán)隊(duì)提出光電融合的全新計(jì)算框架:結(jié)合基于電磁波空間傳播的光計(jì)算,與基于基爾霍夫定律的全模擬電子計(jì)算,在
    的頭像 發(fā)表于 11-05 18:10 ?1139次閱讀

    有史以來(lái)最快的半導(dǎo)體“原子”能將芯片速度提升千倍

    原子”(superatomic)材料已成為已知最快的半導(dǎo)體,并且可能導(dǎo)致計(jì)算機(jī)芯片的速度比當(dāng)今任何可用的任何產(chǎn)品快數(shù)百或數(shù)千倍。
    的頭像 發(fā)表于 11-02 09:38 ?723次閱讀

    NVIDIA 校招 | 芯片架構(gòu)團(tuán)隊(duì)正在熱招!

    。他們與 Compute Arch 團(tuán)隊(duì)合作,追尋更高的?GPU AI 計(jì)算性能,與 Graphics 團(tuán)隊(duì)合作,探究新一代光線追蹤的渲染加速。 在這里,你可以 在這里,你會(huì)和總部團(tuán)隊(duì)
    的頭像 發(fā)表于 11-01 20:25 ?329次閱讀

    清華大學(xué)開發(fā)出超高速光電計(jì)算芯片,性能是商用芯片的3000!

    針對(duì)這難題,清華大學(xué)自動(dòng)化系戴瓊海院士、吳嘉敏助理教授與電子工程系方璐副教授、喬飛副研究員聯(lián)合攻關(guān),提出了種“掙脫”摩爾定律的全新計(jì)算架構(gòu)光電
    的頭像 發(fā)表于 10-31 18:00 ?1186次閱讀
    清華大學(xué)開發(fā)出超高速<b class='flag-5'>光電</b><b class='flag-5'>計(jì)算</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>是商用<b class='flag-5'>芯片</b>的3000<b class='flag-5'>倍</b>!