智能時(shí)代就要到來,芯片市場(chǎng)格局一變?cè)僮?。兩個(gè)典型例子:引領(lǐng)處理器市場(chǎng) 40 多年的英特爾 2015 年底收購(gòu)?fù)?Altera,今年 4 月就宣布計(jì)劃裁員 1.2 萬;另一方面,GPU 巨頭英偉達(dá)今年 3 月推出加速人工智能和深度學(xué)習(xí)的芯片 Tesla P100,投入研發(fā)經(jīng)費(fèi)超過 20 億美元,據(jù)《華爾街日?qǐng)?bào)》報(bào)道,今年 5 月英偉達(dá)售出的 GPU 比去年同月增長(zhǎng) 62%,公司當(dāng)前市值 240 億美元。
深度學(xué)習(xí)應(yīng)用大量涌現(xiàn)使超級(jí)計(jì)算機(jī)的架構(gòu)逐漸向深度學(xué)習(xí)應(yīng)用優(yōu)化,從傳統(tǒng) CPU 為主 GPU 為輔的英特爾處理器變?yōu)?GPU 為主 CPU 為輔的結(jié)構(gòu)。不過,未來相當(dāng)長(zhǎng)一段時(shí)間內(nèi),計(jì)算系統(tǒng)仍將保持 CPU + 協(xié)處理器的混合架構(gòu)。但是,在協(xié)處理市場(chǎng),隨著人工智能尤其是機(jī)器學(xué)習(xí)應(yīng)用大量涌現(xiàn),芯片廠商紛紛完善產(chǎn)品、推出新品,都想成為智能時(shí)代協(xié)處理器的領(lǐng)跑者——但問題是,誰會(huì)擔(dān)當(dāng)這個(gè)角色呢?
TPU:始于谷歌,終于谷歌
要說新的芯片,首先不得不提谷歌在剛剛結(jié)束的 I/O 大會(huì)上披露的 TPU。
有輿論稱,谷歌自己打造芯片,勢(shì)必對(duì)芯片制造商產(chǎn)生巨大影響。確實(shí),面向機(jī)器學(xué)習(xí)專用的處理器是芯片行業(yè)的發(fā)展趨勢(shì),而且未來其他大公司也很有可能組建芯片團(tuán)隊(duì),設(shè)計(jì)自己專用的芯片。
谷歌TPU芯片
TPU 團(tuán)隊(duì)主要負(fù)責(zé)人、計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域大牛 Norm Jouppi 介紹,TPU 專為谷歌 TensorFlow 等機(jī)器學(xué)習(xí)應(yīng)用打造,能夠降低運(yùn)算精度,在相同時(shí)間內(nèi)處理更復(fù)雜、更強(qiáng)大的機(jī)器學(xué)習(xí)模型并將其更快投入使用。 Jouppi 表示,谷歌早在 2013 年就開始秘密研發(fā) TPU,并且在一年前將其應(yīng)用于谷歌的數(shù)據(jù)中心。TPU 從測(cè)試到量產(chǎn)只用了 22 天,其性能把人工智能技術(shù)往前推進(jìn)了差不多 7 年,相當(dāng)于摩爾定律 3 代的時(shí)間。
有媒體評(píng)論稱 TPU 不僅為谷歌帶來了巨大的人工智能優(yōu)勢(shì),也對(duì)市面上已有的芯片產(chǎn)品構(gòu)成了威脅。
這后半句話值得商榷。GPU 巨頭、英偉達(dá) CEO 黃仁勛日前告訴《華爾街日?qǐng)?bào)》,兩年前谷歌就意識(shí)到 GPU 更適合訓(xùn)練,而不善于做訓(xùn)練后的分析決策。由此可知,谷歌打造 TPU 的動(dòng)機(jī)只是想要一款更適合做分析決策的芯片。這一點(diǎn)在谷歌的官方聲明里也得到了印證:TPU 只在特定機(jī)器學(xué)習(xí)應(yīng)用中作輔助使用,公司將繼續(xù)使用其他廠商制造的 CPU 和 GPU。
谷歌云服務(wù)副總裁 Diane Greene 也表示,谷歌并沒有對(duì)外銷售 TPU 的打算——拋開 TPU 本來就是為了谷歌自己設(shè)計(jì)的這個(gè)事實(shí)以外,谷歌對(duì)外銷售芯片的可能性很低,就像 Facebook 主張全球提供免費(fèi)互聯(lián)網(wǎng),也并不是自己要做運(yùn)營(yíng)商。
因此,TPU 再好,也僅適用于谷歌,而且還是用于輔助 CPU 和 GPU。
TrueNorth 坐山觀虎斗?
第二個(gè)要說的是 IBM TrueNorth。IBM 在 2014 年研發(fā)出脈沖神經(jīng)網(wǎng)絡(luò)芯片 TrueNorth,走的是“類腦計(jì)算”的路線。類腦計(jì)算的假設(shè)是,相似的結(jié)構(gòu)可能會(huì)實(shí)現(xiàn)相似的功能,所以類腦計(jì)算研究者使用神經(jīng)形態(tài)器件制造與人腦神經(jīng)網(wǎng)絡(luò)相似的電子神經(jīng)網(wǎng)絡(luò),希望后者具有與人腦類似的功能,并進(jìn)一步反過來理解人類智能。
帶有IBM TrueNorth的DRAPA SyNAPSE
TrueNorth 一張郵票大小,有 54 億個(gè)晶體管,構(gòu)成的神經(jīng)元陣列包含 100 萬個(gè)數(shù)字神經(jīng)元,這些神經(jīng)元之間又通過 2.56 億個(gè)電突觸彼此通信。由于采用了異步架構(gòu),TrueNorth 的能耗很低,54 億個(gè)晶體管僅用 70 毫瓦;而且,只有在特定神經(jīng)元被開啟并和其他神經(jīng)元通信時(shí)才會(huì)產(chǎn)生能耗。TrueNorth 設(shè)計(jì)師 Filipp Akopyan 表示,TrueNorth 的目標(biāo)是 Edge-of-the-Net 和大數(shù)據(jù)解決方案,所以必須要能夠用超低功耗實(shí)時(shí)處理大量數(shù)據(jù)。
在此基礎(chǔ)上,2016年 4 月 IBM 推出了用于深度學(xué)習(xí)的類腦超級(jí)計(jì)算平臺(tái) IBM TrueNorth,含 16 個(gè) TrueNorth 芯片,處理能力相當(dāng)于 1600 萬個(gè)神經(jīng)元和 40 億個(gè)神經(jīng)鍵,消耗的能量只需 2.5 瓦。
將低能耗芯片用于深度學(xué)習(xí)無疑是一大重舉,美國(guó) LLNL 數(shù)據(jù)科學(xué)副主任 Jim Brase 表示,類腦計(jì)算與未來高性能計(jì)算和模擬發(fā)展趨勢(shì)一致。但是,新智元芯片群的幾位專家討論后一致認(rèn)為,TrueNorth 雖然與人腦某些結(jié)構(gòu)和機(jī)理較為接近,但智能算法的精度或效果有待進(jìn)一步提高,離大規(guī)模商業(yè)應(yīng)用還有一段距離。
因此,未來 10 年芯片市場(chǎng)群雄逐鹿,TrueNorth 大概不會(huì)有亮相的機(jī)會(huì)。
寒武紀(jì):中國(guó)的智能芯片
寒武紀(jì)是國(guó)際首個(gè)深度學(xué)習(xí)專用處理器芯片。2012 年,中科院計(jì)算所和法國(guó) Inria 等機(jī)構(gòu)共同提出了國(guó)際上首個(gè)人工神經(jīng)網(wǎng)絡(luò)硬件的基準(zhǔn)測(cè)試集 benchNN。這項(xiàng)工作提升了人工神經(jīng)網(wǎng)絡(luò)處理速度,有效加速了通用計(jì)算,大大推動(dòng)了國(guó)際體系結(jié)構(gòu)學(xué)術(shù)圈對(duì)神經(jīng)網(wǎng)絡(luò)的接納度。此后,中科院計(jì)算所和法國(guó) Inria 的研究人員共同推出了一系列不同結(jié)構(gòu)的 DianNao 神經(jīng)網(wǎng)絡(luò)硬件加速器結(jié)構(gòu)。
寒武紀(jì)芯片板卡
評(píng)論
查看更多