IBM研發(fā)的北極點(diǎn)(NorthPole)處理器芯片可避開(kāi)訪問(wèn)外部存儲(chǔ)器,提高計(jì)算能力,節(jié)約能源。
美國(guó)加利福尼亞州圣何塞的IBM研究人員開(kāi)發(fā)了一種以大腦為靈感的計(jì)算機(jī)芯片,這款北極點(diǎn)處理器芯片消除了頻繁訪問(wèn)外部存儲(chǔ)器的需要,在圖像識(shí)別任務(wù)中比現(xiàn)有架構(gòu)更快,能源消耗更少。這表明計(jì)算和內(nèi)存可以大規(guī)模集成。相關(guān)研究10月19日發(fā)表在《科學(xué)》雜志。
北極點(diǎn)芯片采用神經(jīng)推理結(jié)構(gòu),由簡(jiǎn)單計(jì)算單元組成的多層陣列通過(guò)編程來(lái)識(shí)別數(shù)據(jù)中的模式。底層接收數(shù)據(jù),例如圖像中的像素;每一個(gè)連續(xù)的層檢測(cè)日益復(fù)雜的模式,并將信息傳遞給下一層;頂層輸出結(jié)果,例如可以表示圖像含有貓、汽車或其他物體的可能性。
在傳統(tǒng)馮·諾伊曼架構(gòu)下,計(jì)算和存儲(chǔ)分離。傳統(tǒng)計(jì)算機(jī)芯片可以有效處理計(jì)算,但每次計(jì)算時(shí)仍然需要使用被稱為RAM的外部存儲(chǔ)器。因此不管處理器運(yùn)行多快、性能多好,每次執(zhí)行運(yùn)算時(shí)都需要把數(shù)據(jù)從存儲(chǔ)器搬到處理器中,數(shù)據(jù)處理完再搬回到存儲(chǔ)器。在以數(shù)據(jù)為主的AI計(jì)算之下,馮·諾伊曼架構(gòu)的“存儲(chǔ)墻”和“功耗墻”挑戰(zhàn)凸顯。論文合著者、IBM計(jì)算機(jī)工程師達(dá)門德拉·莫達(dá)(Dharmendra Modha)表示,他曾估計(jì)在這種架構(gòu)上模擬人類大腦可能需要12個(gè)核反應(yīng)堆的能源輸出。
而北極點(diǎn)芯片使存儲(chǔ)單元在物理上盡可能接近計(jì)算單元中的計(jì)算元件。北極點(diǎn)芯片由256個(gè)計(jì)算單元組成,每個(gè)計(jì)算單元都有內(nèi)存,通過(guò)消除片外內(nèi)存,將計(jì)算與片上內(nèi)存交織在一起。這些計(jì)算單元以一種網(wǎng)絡(luò)連接在一起,這種網(wǎng)絡(luò)的靈感來(lái)自于人類大腦皮層之間的白質(zhì)連接。
在不使用最先進(jìn)工藝的情況下,北極點(diǎn)芯片能耗是使用最先進(jìn)技術(shù)的人工智能芯片的1/5。論文作者估計(jì),如果北極點(diǎn)芯片設(shè)計(jì)采用最先進(jìn)的制造工藝,其效率將是目前設(shè)計(jì)的25倍。論文提到,“在ResNet50基準(zhǔn)圖像分類網(wǎng)絡(luò)上,相對(duì)于使用類似12納米技術(shù)工藝的GPU, 北極點(diǎn)實(shí)現(xiàn)了每瓦FPS(每秒傳輸幀數(shù))的能量度量高25倍,每個(gè)晶體管FPS的空間度量高5倍,延遲時(shí)間度量低22倍?!?/p>
不過(guò),據(jù)《自然》雜志報(bào)道,即使是北極點(diǎn)芯片224兆內(nèi)存對(duì)于大型語(yǔ)言模型來(lái)說(shuō)也是不夠的,比如聊天機(jī)器人ChatGPT這樣的語(yǔ)言模型,即使在最精簡(jiǎn)的版本中也要占用幾千兆的數(shù)據(jù)。而且該芯片只能運(yùn)行預(yù)先編程的神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)需要在單獨(dú)的機(jī)器上提前訓(xùn)練。但論文作者表示,北極點(diǎn)芯片架構(gòu)可能在速度關(guān)鍵型應(yīng)用中有用,比如自動(dòng)駕駛汽車。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
452文章
50206瀏覽量
420893 -
內(nèi)存
+關(guān)注
關(guān)注
8文章
2966瀏覽量
73812 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268103
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論