想要提高芯片之間的通訊速度,應(yīng)該怎么做呢?傳統(tǒng)的思路是優(yōu)化芯片之間的通信接口。
谷歌發(fā)布了CloudTPU測(cè)試版,以及GoogleKubernetesEngine的GPU。比如谷歌云服務(wù)中心使用的AI芯片TPU,就專門在每塊芯片上都專門設(shè)計(jì)了4個(gè)用來(lái)做芯片之間通信的接口,但是這種思路有一個(gè)天花板,就是如今的接口技術(shù),芯片之間的通信技術(shù),達(dá)到每秒鐘幾百甚至上千GB,就已經(jīng)接近極限了,再要提升,技術(shù)上可能會(huì)非常困難,這里要額外提一句,每秒鐘幾百GB的速度,聽(tīng)起來(lái)還是挺快的,但對(duì)于云計(jì)算中心而言,依然會(huì)成為制約整個(gè)系統(tǒng)運(yùn)算性能的關(guān)鍵因素,那還有什么別的辦法可以繼續(xù)提高數(shù)據(jù)傳輸速度呢?
這里就要說(shuō)到Cerebras這家公司的“巨無(wú)霸”芯片了,它的思路就是把很多塊小芯片合在一起,做成一塊大芯片,這樣原來(lái)需要很多芯片之間相互通信的任務(wù),就可以在芯片內(nèi)部進(jìn)行數(shù)據(jù)傳輸了。要知道,芯片在自己內(nèi)部傳輸數(shù)據(jù)的速度,是遠(yuǎn)遠(yuǎn)高于芯片之間通信的速度的,這就如同,我們左腦跟右腦互相溝通的速度,肯定比我們跟別人溝通說(shuō)話的速度要快,事實(shí)上,按照這家公司披露的數(shù)據(jù),這塊芯片內(nèi)部通信網(wǎng)絡(luò)的速度,可以達(dá)到1000PB每秒,是目前最快的芯片之間的通信接口速度的10萬(wàn)倍。如果未來(lái)超級(jí)計(jì)算機(jī),都使用這種“巨無(wú)霸”芯片,那就能夠很好的解決芯片間通信速度。
這個(gè)制約運(yùn)算速度的瓶頸對(duì)整體性能的制約影響,那既然把計(jì)算芯片做大有那么多的好處,為什么以前就沒(méi)人做呢,事實(shí)上,不是沒(méi)人做,而是這件事太難了,還沒(méi)有人能做到,為什么這么說(shuō)呢,問(wèn)題的關(guān)鍵就在“可靠性”三個(gè)字上,眾所周知,所有的芯片都是在一塊圓形的硅片上,經(jīng)過(guò)非常精細(xì)的半導(dǎo)體工藝加工而成的,在加工的過(guò)程中,難免會(huì)有一些加工缺陷和誤差,導(dǎo)致硅片上局部失效。在過(guò)去,一片硅片上通常會(huì)切割出幾百塊小芯片,而這些局部工藝的誤差,頂多也就是影響其中一部分芯片,我們只需要把剩下的部分完好無(wú)損的挑出來(lái),就可以到市場(chǎng)上銷售了。
看到這里你可能已經(jīng)明白了,既然加工過(guò)程中,難免會(huì)出現(xiàn)一些工藝缺陷,那一塊芯片的面積越大,上面出現(xiàn)缺陷的概率就越大。所以想要成功的把它制造出來(lái)的難度也就越高,像這次發(fā)布的“巨無(wú)霸”芯片,面積是過(guò)去芯片的50多倍,對(duì)于工藝可靠性的要求理論上也就提高了50多個(gè)量級(jí),這么高的可靠性要求,在過(guò)去是很難做到的,這也就是,在過(guò)去很少有這種超大型芯片的原因。
責(zé)任編輯人:CC
-
芯片
+關(guān)注
關(guān)注
453文章
50252瀏覽量
421121 -
通信接口
+關(guān)注
關(guān)注
3文章
234瀏覽量
30954
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論