0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

盤點(diǎn)AI芯片全新黑科技

ml8z_IV_Technol ? 來源:未知 ? 作者:胡薇 ? 2018-07-19 09:47 ? 次閱讀

許多在AI芯片領(lǐng)域來自學(xué)術(shù)界和來自工業(yè)界的項(xiàng)目,試圖挑戰(zhàn)CPUGPU。這些項(xiàng)目大體可以分為兩類,一類是基于傳統(tǒng)的數(shù)字處理器模型,但是在處理器架構(gòu)上加以改良,以提高算力以及能效比;第二類則是另辟蹊徑,使用了與傳統(tǒng)處理器完全不一樣的方法來執(zhí)行計(jì)算,從而在一些領(lǐng)域中獲得遠(yuǎn)高于傳統(tǒng)處理器的性能。今天我們?yōu)榇蠹規(guī)淼氖堑诙惣夹g(shù)的總結(jié),我們預(yù)期在第二類技術(shù)中會(huì)有一些能經(jīng)歷時(shí)間的考驗(yàn),最終成為主流技術(shù)。

隨著大數(shù)據(jù)和深度學(xué)習(xí)得到越來越多應(yīng)用,對(duì)于底層硬件和芯片也提出了新的要求。與傳統(tǒng)的處理器強(qiáng)調(diào)“處理能力”不同,大數(shù)據(jù)和深度學(xué)習(xí)應(yīng)用強(qiáng)調(diào)的往往是“算力”以及“能效比”。由于大數(shù)據(jù)和深度學(xué)習(xí)應(yīng)用算法中的特征提取和處理使用的都往往是實(shí)打?qū)嵉挠?jì)算,因此需要高算力的芯片以期在盡可能短的時(shí)間里完成計(jì)算。另一方面,能效比也是重要指標(biāo)。能效比指的是完成計(jì)算所需要的能量,能效比越好則完成相同計(jì)算消耗的能量越小。

對(duì)于終端芯片, 越來越多的數(shù)據(jù)由于數(shù)據(jù)隱私、網(wǎng)絡(luò)傳輸帶寬和處理延遲的問題無法傳到云端數(shù)據(jù)中心完成計(jì)算,這也就需要終端芯片能在終端完成計(jì)算;同時(shí)終端設(shè)備的電池容量往往有限,因此終端芯片在完成計(jì)算的同時(shí)不能消耗太大能量,也就是需要很好的能效比。對(duì)于云端數(shù)據(jù)中心的芯片,同樣也需要很好的能效比,因?yàn)樯岢杀臼菙?shù)據(jù)中心的重要開銷,因此需要芯片散熱不能太大。

在大數(shù)據(jù)和深度學(xué)習(xí)應(yīng)用中,數(shù)據(jù)間往往都是獨(dú)立的,因此可以并行計(jì)算。傳統(tǒng)的CPU并行計(jì)算能力有限,因此難以實(shí)現(xiàn)算力的需求。GPU雖然有很高的算力(10TOPS數(shù)量級(jí))而且在數(shù)據(jù)中心已經(jīng)得到了應(yīng)用,但是其功耗也很大(幾百瓦),而且其架構(gòu)決定了它無法做到終端需要較低功耗(如100mW以下)的場(chǎng)景。同時(shí),即使在數(shù)據(jù)中心領(lǐng)域,因?yàn)镚PU設(shè)計(jì)的初衷是為了圖像渲染而并非大數(shù)據(jù)運(yùn)算,因此也存在很大的改善空間。

因此,我們看到了許多在AI芯片領(lǐng)域來自學(xué)術(shù)界和來自工業(yè)界的項(xiàng)目,試圖挑戰(zhàn)CPU和GPU。這些項(xiàng)目大體可以分為兩類,一類是基于傳統(tǒng)的數(shù)字處理器模型,但是在處理器架構(gòu)上加以改良,以提高算力以及能效比;第二類則是另辟蹊徑,使用了與傳統(tǒng)處理器完全不一樣的方法來執(zhí)行計(jì)算,從而在一些領(lǐng)域中獲得遠(yuǎn)高于傳統(tǒng)處理器的性能。今天我們?yōu)榇蠹規(guī)淼氖堑诙惣夹g(shù)的總結(jié),我們預(yù)期在第二類技術(shù)中會(huì)有一些能經(jīng)歷時(shí)間的考驗(yàn),最終成為主流技術(shù)。

神經(jīng)擬態(tài)計(jì)算

神經(jīng)擬態(tài)技術(shù)(neuromorphic)事實(shí)上源遠(yuǎn)流長(zhǎng),上世紀(jì)八九十年代就由加州理工的電路大師Carver Mead提出。當(dāng)時(shí)Mead教授注意到MOS器件中電荷流動(dòng)的現(xiàn)象和人體神經(jīng)元的放電現(xiàn)象有類似的地方,因此提出了用MOS管模擬神經(jīng)元以組成神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算,稱之為“神經(jīng)擬態(tài)”。

需要注意的是,神經(jīng)擬態(tài)中的神經(jīng)網(wǎng)絡(luò)和現(xiàn)在深度學(xué)習(xí)算法中的神經(jīng)網(wǎng)絡(luò)略有不同。神經(jīng)擬態(tài)電路中的神經(jīng)網(wǎng)絡(luò)是對(duì)于生物神經(jīng)元和突觸的高度模擬,包括了神經(jīng)電位改變、發(fā)射脈沖等過程,該過程既可以用異步數(shù)字電路實(shí)現(xiàn),又可以用混合信號(hào)電路實(shí)現(xiàn);而深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)是對(duì)于生物學(xué)中神經(jīng)組織的抽象數(shù)學(xué)模擬,僅僅描繪了其電位變化的統(tǒng)計(jì)學(xué)特性而不會(huì)去具體描繪其充放電過程。然而,這個(gè)充放電過程卻可能是為什么人腦如此節(jié)省能量的一個(gè)關(guān)鍵。人腦中復(fù)雜的神經(jīng)網(wǎng)絡(luò)能實(shí)現(xiàn)極其復(fù)雜的推理認(rèn)知過程,然而其功耗卻遠(yuǎn)小于一個(gè)GPU。

2017年5月美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室發(fā)表了一篇重要的神經(jīng)擬態(tài)研究綜述,應(yīng)當(dāng)說目前人們對(duì)于神經(jīng)擬態(tài)的研究還處于初步階段,許多神經(jīng)擬態(tài)架構(gòu)的潛力還沒有被人們發(fā)現(xiàn),同時(shí)如何訓(xùn)練神經(jīng)擬態(tài)電路也是一個(gè)重要的挑戰(zhàn)。從現(xiàn)在的研究來看,人們發(fā)現(xiàn)神經(jīng)擬態(tài)的神經(jīng)元在不被激活的情況下功耗較低,因此可以實(shí)現(xiàn)較低的平均功耗,這是一個(gè)重要的優(yōu)勢(shì)。

舉例來說,當(dāng)我們部署一套攝像頭加人工智能系統(tǒng)來識(shí)別是否有人進(jìn)入攝像頭視野時(shí),往往很多時(shí)間并沒有人出現(xiàn)在視野內(nèi)。在這種情況下,使用傳統(tǒng)的深度學(xué)習(xí)算法無論攝像頭事業(yè)內(nèi)情況如何都需要完成同樣的計(jì)算,因此功耗保持恒定;而如果使用神經(jīng)擬態(tài)芯片則神經(jīng)元僅僅在有人進(jìn)入攝像頭事業(yè)時(shí)被激活,而在平時(shí)沒有人進(jìn)入視野時(shí)神經(jīng)元處于待機(jī)狀態(tài)功耗很低,因此其平均功耗可以遠(yuǎn)低于傳統(tǒng)深度學(xué)習(xí)芯片。

換句話說,神經(jīng)擬態(tài)電路的能效比可以遠(yuǎn)高于傳統(tǒng)GPU/CPU芯片。除此之外,使用在終端的低功耗神經(jīng)擬態(tài)芯片還能完成在線學(xué)習(xí),而使用在終端的傳統(tǒng)深度學(xué)習(xí)推理加速芯片往往沒有在線學(xué)習(xí)的能力。這僅僅是神經(jīng)擬態(tài)電路的一些好處,神經(jīng)擬態(tài)電路的其他潛力還等待人們?nèi)ネ诰颉?/p>

神經(jīng)擬態(tài)電路芯片的潛力也是一些大公司開始布局的原因。IBM和Intel都推出了自己的神經(jīng)擬態(tài)芯片(IBM和TrueNorth和Intel的Loihi),可以實(shí)現(xiàn)非常高的能效比。我們預(yù)期在未來看到更多的神經(jīng)擬態(tài)電路芯片發(fā)布,能更多挖掘神經(jīng)擬態(tài)的潛力。

光電計(jì)算

硅光子技術(shù)目前在數(shù)據(jù)中心和5G的高速數(shù)據(jù)傳輸中獲得了越來越多的應(yīng)用。除此之外,硅光子還可以用來以超低功耗直接加速深度學(xué)習(xí)計(jì)算。

2017年,MIT的Marin Solijacic教授和其研究組在《自然·光子學(xué)》期刊上發(fā)表了一篇使用光學(xué)器件加速深度學(xué)習(xí)計(jì)算的論文。在深度學(xué)習(xí)中,絕大部分計(jì)算都可以歸化為矩陣運(yùn)算(這也是GPU用來做深度學(xué)習(xí)的原理),而實(shí)際應(yīng)用中的矩陣都可以用SVD分解分解成幾個(gè)特征矩陣的乘積。一旦使用SVD分解,則兩個(gè)矩陣相乘可以使用光學(xué)器件(相移器,分光器,衰減器和馬赫-曾德干涉儀)來實(shí)現(xiàn)。

更重要的是,兩個(gè)矩陣相乘的過程可以轉(zhuǎn)化為兩束光的干涉,因此深度學(xué)習(xí)的計(jì)算可以以光速完成而且理論功耗為零!該論文提出的設(shè)計(jì)就是首先把深度學(xué)習(xí)的兩個(gè)輸入調(diào)制到兩束光上面,然后讓兩束光在光子芯片的器件上完成SVD分解和干涉相乘,最后再把光信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)讀出結(jié)果。最后,這些光器件都可以集成到同一塊硅光子芯片上,從而實(shí)現(xiàn)高性能光計(jì)算模組。

MIT的光模塊用于計(jì)算深度學(xué)習(xí)

如前所述,一旦使用光干涉來實(shí)現(xiàn)深度學(xué)習(xí)計(jì)算,其計(jì)算速度就變成了光速,此外矩陣計(jì)算的功耗就變成了0,因此一旦能把光調(diào)制、光信號(hào)讀出等光信號(hào)處理和接口模塊的性能和功耗做好,整體系統(tǒng)的性能和能效比就能快速提升。 MIT的光計(jì)算團(tuán)隊(duì)孵化出了 初創(chuàng)公司Lightelligence,目前已經(jīng)完成A輪融資,光電子用于深度學(xué)習(xí)的前景讓我們共同拭目以待。

內(nèi)存內(nèi)計(jì)算

傳統(tǒng)的AI加速器幾乎都是基于馮諾伊曼架構(gòu),即內(nèi)存訪問和計(jì)算是分開的。馮諾伊曼架構(gòu)的問題是內(nèi)存訪問,因?yàn)閮?nèi)存訪問的功耗和延遲等問題都很難降下來,因此內(nèi)存成為了處理器性能和功耗的瓶頸,也即所謂的“內(nèi)存墻”。

為了解決內(nèi)存墻問題,不少學(xué)者提出了內(nèi)存內(nèi)計(jì)算的概念,這種概念在今年ISSCC上更是擁有了一個(gè)專門的session,可見學(xué)界對(duì)于這個(gè)方向還是很認(rèn)可的。最著名的研究當(dāng)屬M(fèi)IT Anantha Chandrakasan組。Anantha Chandrakasan在芯片領(lǐng)域可謂是鼎鼎大名,是數(shù)字電路經(jīng)典教科書《Digital Integrated Circuits: A Design Perspective》的作者之一,同時(shí)也是低功耗數(shù)字電路設(shè)計(jì)、UWB系統(tǒng)等多個(gè)領(lǐng)域的先驅(qū)者,基本每年Chandrakasan組在ISSCC都會(huì)至少有一篇論文發(fā)表。今年ISSCC上Chandrakasan組發(fā)表的內(nèi)存內(nèi)計(jì)算論文針對(duì)的是權(quán)重壓縮至1-bit的神經(jīng)網(wǎng)絡(luò),當(dāng)權(quán)重僅僅為1-bit的時(shí)候,卷積就可以約化成多個(gè)數(shù)據(jù)的平均,而求平均值使用經(jīng)典的DAC中常用的電荷平均方法可以輕易實(shí)現(xiàn)。

因此,該內(nèi)存中計(jì)算的論文實(shí)質(zhì)上是在片上SRAM上接了一個(gè)類似DAC中電荷平均的電路,在內(nèi)存內(nèi)直接實(shí)現(xiàn)模擬計(jì)算來求卷積,從而不用再需要處理器和內(nèi)存之間耗費(fèi)大量時(shí)間和能量移動(dòng)數(shù)據(jù)。計(jì)算后的結(jié)果使用ADC可以再次轉(zhuǎn)化為數(shù)字信號(hào)。

相比傳統(tǒng)的數(shù)字電路AI加速器,使用內(nèi)存內(nèi)計(jì)算加模擬計(jì)算的電路可以把能效比提高60倍以上,顯示出了極大的潛力。當(dāng)然,現(xiàn)在該電路還只能針對(duì)1-bit權(quán)重的網(wǎng)絡(luò),未來如何把內(nèi)存內(nèi)計(jì)算推廣到更多應(yīng)用場(chǎng)景,讓我們拭目以待。

量子計(jì)算

量子計(jì)算是真正顛覆性的范式——當(dāng)然前提是需要先能把量子計(jì)算機(jī)制造出來!

量子計(jì)算和經(jīng)典計(jì)算最大的不同在于,量子計(jì)算使用的是量子態(tài)。不同的量子態(tài)之間是可以互相線性疊加的,因此一個(gè)量子比特在測(cè)量前可以同時(shí)處于多個(gè)態(tài)的疊加中。而量子計(jì)算可以同時(shí)對(duì)多個(gè)疊加態(tài)進(jìn)行操作,因此相當(dāng)于做大量平行計(jì)算。

現(xiàn)在量子計(jì)算還處于非常早期研究階段,目前只有少數(shù)量子算法可以利用量子特性實(shí)現(xiàn)指數(shù)級(jí)的加速,所謂“量子霸權(quán)”就是指在某個(gè)特定算法可以制造出相應(yīng)的量子計(jì)算機(jī)使運(yùn)行速度超過經(jīng)典計(jì)算機(jī)。那么,量子計(jì)算如何加速人工智能呢?首先,目前正在積極研究量子版本的線性代數(shù)算法,有望實(shí)現(xiàn)指數(shù)級(jí)加速,而AI算法中許多計(jì)算的基礎(chǔ)正是線性代數(shù),因此一旦線性代數(shù)的量子版算法開發(fā)完成就可以大大加速人工智能計(jì)算。另外,以D-Wave為代表的量子退火算法有望能加速最優(yōu)化問題,而人工智能訓(xùn)練的一個(gè)最重要問題其實(shí)就是求最優(yōu)化解。因此,量子計(jì)算有望能加速人工智能。

谷歌和UCSB聯(lián)合研發(fā)的20量子比特芯片

目前量子計(jì)算芯片有許多實(shí)現(xiàn)方式,包括工作在超低溫下的離子阱和超導(dǎo)電路以及工作在常溫的非線性光器件。應(yīng)該說這些芯片目前還在很初期的階段,雖然有些芯片已經(jīng)能實(shí)現(xiàn)很多量子比特,但是量子退相干時(shí)間和量子門保真度仍然是性能的瓶頸。量子計(jì)算進(jìn)入實(shí)用還有很長(zhǎng)的路要走,但是一旦成功將會(huì)成為顛覆式的發(fā)展,這也是谷歌、IBM和微軟等巨頭都在積極布局量子計(jì)算的原因。

結(jié)語

本文介紹了一些全新的人工智能芯片技術(shù),包括神經(jīng)擬態(tài)、光電計(jì)算、內(nèi)存內(nèi)計(jì)算和量子計(jì)算。傳統(tǒng)基于馮諾伊曼架構(gòu)的人工智能加速器芯片存在內(nèi)存墻等各種限制,我們有望看到這些新技術(shù)能在幾年后正式登上舞臺(tái)得到廣泛應(yīng)用。讓我們拭目以待!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 量子計(jì)算
    +關(guān)注

    關(guān)注

    4

    文章

    1072

    瀏覽量

    34864
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1850

    瀏覽量

    34849

原文標(biāo)題:AI芯片黑科技盤點(diǎn)

文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    全球十大AI訓(xùn)練芯片盤點(diǎn):華為昇騰910是中國(guó)唯一入選

    英國(guó)一名資深芯片工程師James W. Hanlon,盤點(diǎn)了當(dāng)前十大AI訓(xùn)練芯片。本文對(duì)十大芯片的主要性能進(jìn)行了匯總。
    的頭像 發(fā)表于 10-15 10:47 ?1.6w次閱讀

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37

    AI芯片哪里買?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    AI智能芯片火熱,全芯片產(chǎn)業(yè)鏈都積極奔著人工智能去

    AI分析的全新功能(如今年IFA展上,華為基于麒麟980推出的“慧眼2.0”),競(jìng)爭(zhēng)門檻也進(jìn)一步拉高。擁有先發(fā)優(yōu)勢(shì)的玩家們,則更為積極地在AI芯片道路上飛速奔跑。先是8月的最后一天,華
    發(fā)表于 10-10 18:03

    AI發(fā)展對(duì)芯片技術(shù)有什么影響?

    現(xiàn)在說AI是未來人類技術(shù)進(jìn)步的一大方向,相信大家都不會(huì)反對(duì)。說到AI芯片技術(shù)的關(guān)系,我覺得主要體現(xiàn)在兩個(gè)方面:第一,AI的發(fā)展要求芯片技術(shù)
    發(fā)表于 08-12 06:38

    盤點(diǎn):史上的25個(gè)經(jīng)典芯片

    創(chuàng)造出更多的技術(shù)詞匯來描述它們。甚至可以說是它們?yōu)槲覀儙砹俗屔钭兒?jiǎn)潔的技術(shù),沒有它們我們的生活將變得冗長(zhǎng)乏味。下面盤點(diǎn)這25款微芯片,他們?cè)?jīng)震撼了世界改變了我們的生活!`
    發(fā)表于 07-02 14:30

    【免費(fèi)申請(qǐng)】守衛(wèi)安全的“科技”,HiSpark AI Camera勇?lián)厝?/a>

    門禁,車站機(jī)場(chǎng)安檢,大到犯罪嫌疑人追蹤與金融交易,生物特征識(shí)別均存在著廣泛的應(yīng)用空間。本期試用活動(dòng)給大家?guī)硎匦l(wèi)安全的“科技”——HiSpark AI Camera HarmonyOS 官方定制開發(fā)板,感受
    發(fā)表于 09-10 14:43

    Elliptic Labs與鯊再聯(lián)手,兩款全新智能手機(jī)搭載 AI Virtual Smart Sensor?

    全球化AI軟件公司及AI Virtual Smart Sensors?領(lǐng)域的世界領(lǐng)導(dǎo)者Elliptic Labs (EuroNext Growth: ELABS.OL)與一流的游戲智能手機(jī)制造商
    發(fā)表于 10-14 11:47

    AGM X2的戶外科技大盤點(diǎn)!

    AGM宣布8月16日舉行AGM X2發(fā)布會(huì),在天貓和京東已能夠看到AGM X2的預(yù)約頁面。隨著發(fā)布會(huì)越來越接近曝光的力度越來越大,而AGM X2作為一款適合戶外人群使用的手機(jī),究竟有什么科技來支撐他們定位的,戶外人群。接下來就一起來盤點(diǎn)AGM X2的戶外
    發(fā)表于 08-15 08:53 ?1.7w次閱讀

    2018ces展會(huì)有哪些科技_ces科技盤點(diǎn)

     2018年第51屆國(guó)際消費(fèi)類電子產(chǎn)品展覽會(huì)(簡(jiǎn)稱CES)于美國(guó)時(shí)間1月9日-12日在拉斯維加斯召開。CES是世界上最大、影響最為廣泛的消費(fèi)類電子技術(shù)年展,也是全球最大的消費(fèi)技術(shù)盛會(huì)。那么在2018ces展會(huì)出現(xiàn)了哪些科技?今天小編就來盤點(diǎn)一下。
    發(fā)表于 01-10 14:56 ?3926次閱讀

    Intel推全新云端AI芯片NNP--“Spring Crest”

    昨天,Intel第一屆AI開發(fā)者大會(huì)AIDC 2018在美國(guó)舊金山藝術(shù)宮內(nèi)舉辦。在英特爾AI總帥、人工智能事業(yè)部(AIPG)總負(fù)責(zé)人Naveen Rao的演講當(dāng)中,Intel全新云端AI
    的頭像 發(fā)表于 06-08 11:46 ?3997次閱讀

    IBM全新AI芯片設(shè)計(jì)登上Nature,解決GPU的算力瓶頸

    現(xiàn)如今的人工智能的神經(jīng)網(wǎng)絡(luò)與GPU密不可分,但是GPU的算力對(duì)于未來神經(jīng)網(wǎng)絡(luò)的發(fā)展是不夠用的,好在IBM全新AI芯片設(shè)計(jì),能夠解決GPU的算力瓶頸。
    發(fā)表于 06-13 09:28 ?1396次閱讀

    鯊科技官方宣布啟用全新logo 鯊3將成為首部換裝全新logo的新機(jī)

    2月23日夜間,鯊科技官方宣布,鯊品牌全面升級(jí),同時(shí)啟用全新logo。毫無疑問,接下來的鯊3將成為首部換裝全新logo的新機(jī)。
    的頭像 發(fā)表于 02-24 09:31 ?4482次閱讀

    中國(guó)芯片公司排名_中國(guó)十大芯片企業(yè)盤點(diǎn)

    本文主要闡述了中國(guó)十大芯片企業(yè)盤點(diǎn)。
    的頭像 發(fā)表于 08-10 09:51 ?39.1w次閱讀

    AMD發(fā)布全新AI芯片Instinct MI325X

    在近日舉行的COMPUTEX臺(tái)北國(guó)際電腦展上,AMD董事長(zhǎng)兼CEO蘇姿豐發(fā)表了精彩演講,并正式發(fā)布了一款備受矚目的AI芯片——Instinct MI325X。這款芯片預(yù)計(jì)將于2024年第四季度正式上市,將為
    的頭像 發(fā)表于 06-04 14:49 ?917次閱讀