0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

史上最大芯片將用于這兩個項目

汽車玩家 ? 來源:今日頭條 ? 作者:今日頭條 ? 2019-11-25 16:09 ? 次閱讀

今年 8 月,集成 1.2 萬億個晶體管的“史上最大芯片”The Cerebras Wafer Scale Engine(以下簡稱 WSE)誕生,在 11 月 19 日召開的 Supercomputing 2019 大會上,該芯片制造公司 Cerebras Systems 推出了搭載該芯片的計算機系統(tǒng)————Cerebras CS-1,這也將是世界上最強大的 AI 計算系統(tǒng)。美國兩家國家實驗室是該公司的客戶,其中,阿貢國家實驗室已成功部署并宣布,將用這套系統(tǒng)來發(fā)現(xiàn)癌癥療法和理解黑洞碰撞。

圖 | Cerebras CS-1(來源:Cerebras Systems)

CS-1 搭載的并不是一個芯片,而是一整個晶圓。通常,硅芯片是從 8、10 或 12 英寸等不同規(guī)格的晶圓上單獨切下來的。而 Cerebras 把晶圓切割成一個很大的長方形,每個芯片都相互連接,可以使每個晶體管都能像整體一樣高速運轉(zhuǎn)。一個典型處理器可能在一個芯片上有 100 億個晶體管,而 CS-1 搭載的整個晶片上所有核的晶體管總數(shù)超過 1.2 萬億個。

在 AI 計算中,芯片尺寸至關(guān)重要,但是高級處理器必須要有專用的硬件和軟件系統(tǒng)相配合才能實現(xiàn)理想的性能。Cerebras 公司 CEO Andrew Feldman 在接受媒體采訪時說:“你無法將法拉利發(fā)動機放入大眾汽車中來獲得法拉利性能。如果你想獲得 1,000 倍的性能提升,你要做的就是消除瓶頸?!盋S-1 系統(tǒng)設(shè)計和 Cerebras 軟件平臺相結(jié)合,可以充分用到從 WSE 上的 40 多萬個計算內(nèi)核和 18 GB 高性能片上存儲器中提取的每一點的處理能力。

GIF 圖 | Cerebras 晶片規(guī)模的引擎(來源:Cerebras Systems)

GPU 集群需要消耗數(shù)十個機架并且需要專有的 InfiniBand 進行集群不同,CS-1 不需要大量修改現(xiàn)有模型,并且用戶只需將基于標準的 100Gb 以太網(wǎng)鏈路插入交換機就可以啟動培訓(xùn)模型。

CS-1 有 15 個機架,大概是 26 英寸高(66.04 厘米)。Andrew Feldman 表示,CS-1 是“最快的 AI 計算機”。CS-1 計算機的機器學(xué)習(xí)能力相當(dāng)于數(shù)百架基于 GPU 的計算機能力,這些計算會消耗數(shù)百千瓦。但 CS-1 僅消耗 17 千瓦,占標準機架能耗的三分之一。他把 CS-1 和谷歌的 TPU 計算集群相比,強調(diào)谷歌的 TPU2 機器學(xué)習(xí)集群需要 10 個機架和超過 100 千瓦的功耗,才能提供一個 CS-1 機箱三分之一的性能。

Feldman 說:“我們是由 40 萬個專用 AI 處理器組成的 AI 機器?!盋S-1 由 40 萬核、1 萬億晶體管大小的處理器芯片驅(qū)動,可以將原本需要至少幾周的大型神經(jīng)網(wǎng)絡(luò)訓(xùn)練任務(wù)縮短到幾分鐘甚至幾秒鐘。但是,Cerebras 并沒有提供用標準 AI 基準(如新的 MLPeRF 標準)衡量性能的數(shù)據(jù)。相反,它通過讓潛在客戶在 Cerebras 的機器上訓(xùn)練他們自己的神經(jīng)網(wǎng)絡(luò)模型來吸引潛在客戶。

另外,Cerebras 還公布了一些系統(tǒng)軟件的細節(jié),該軟件允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標準框架來編寫他們的機器學(xué)習(xí)模型。強大的圖形編譯器可自動將這些模型轉(zhuǎn)換為 CS-1 的優(yōu)化可執(zhí)行文件,而豐富的工具集可實現(xiàn)直觀的模型調(diào)試和性能分析。

圖 | Cerebras 軟件系統(tǒng)允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標準框架來編寫他們的機器學(xué)習(xí)模型(來源:Cerebras Systems)

這是如何實現(xiàn)的呢?通過解決一個優(yōu)化問題,確保所有層以大致相同的速度完成它們的任務(wù)處理,且與相鄰層是連續(xù)的。這樣信息就可以實現(xiàn)在網(wǎng)絡(luò)中暢通無阻。該軟件可以在多臺計算機上執(zhí)行這個優(yōu)化問題,如果把 32 個 CS-1 連接在一起,那么這一組計算機所構(gòu)成的大型計算機的性能可以提高約 32 倍。

Feldman 說:“GPU 集群無法實現(xiàn)相同的效果,你得到的不是一個大型計算機的算力,仍然是一堆小機器所能實現(xiàn)的算力?!彼J為 CS-1 和 GPU 集群形成了鮮明的對比。

CS-1 的第一個應(yīng)用是預(yù)測癌癥藥物反應(yīng),這是美國能源部和美國國家癌癥研究所合作的一個項目。能源部負責(zé)人工智能與技術(shù)的副部長 Dimitri Kusnezov 在一份聲明中說:“在能源部,我們相信公私合作是加速美國人工智能研究的重要組成部分?!薄拔覀兤诖c Cerebras 建立長期而富有成效的合作關(guān)系,這將有助于定義下一代人工智能技術(shù),并改變能源部的運作、業(yè)務(wù)和使命?!被蛟S這也是 Feldman 能籌集到數(shù)億美元并雇用大量員工的原因。

圖 | 阿貢實驗室(Argonne National Laboratory)

阿貢實驗室與 Cerebras 的合作已經(jīng)有兩年了。其計算總監(jiān) Rick Stevens 在新聞發(fā)布會上表示:“通過部署 CS-1,我們大大縮短了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間,使我們的研究人員能夠更高效地開展深度學(xué)習(xí)研究,在癌癥、創(chuàng)傷性腦損傷以及當(dāng)今和未來對社會有重要意義的其他領(lǐng)域取得重大進展。”

阿貢實驗室是全球最大的超級計算機站點之一,而 CS-1 可以使這個站點比現(xiàn)有的 AI 加速器得到 100 到 1000 倍的提升,有望在 2021 年實現(xiàn) Aurora 百萬兆級超算的能力。一臺百萬兆級的計算機一瞬間進行的計算量,相當(dāng)于地球上的所有人每天每秒都不停地計算四年。

除了用在研究抗癌藥物之外,該系統(tǒng)還將被用來幫助理解黑洞碰撞行為及其引力波。此前做過類似研究的 Theta 超級計算機,在研究黑洞碰撞問題時需要調(diào)動超算所配置的 4392 個節(jié)點中的 1024 個節(jié)點,每個節(jié)點包含了一個 64 核處理器和 16 GB 的高帶寬封裝內(nèi)存(MCDRAM),192 GB 的 DDR4 RAM 和 128 GB 的 SSD。

Cerebras 的另一個客戶勞倫斯·利弗莫爾國家實驗室也來頭不小,擁有世界排名第三的 Sequoia 超級計算機。CS-1 也有望進一步增強其模擬計算能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18927

    瀏覽量

    227231
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9502

    瀏覽量

    136935
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266228
收藏 人收藏

    評論

    相關(guān)推薦

    單相電機兩個繞組都在定子上嗎

    單相電機的兩個繞組,即起動線圈(或稱為輔助繞組、副繞組)和運行線圈(或稱為主繞組),都位于定子上 。這兩個繞組在電機中起著關(guān)鍵作用,共同協(xié)作以產(chǎn)生旋轉(zhuǎn)磁場,從而使電機能夠運轉(zhuǎn)。 單相電機通常由一
    的頭像 發(fā)表于 09-03 15:10 ?170次閱讀

    觸發(fā)器的兩個穩(wěn)定狀態(tài)分別是什么

    觸發(fā)器作為數(shù)字電路中的基本邏輯單元,具有兩個穩(wěn)定狀態(tài),這兩個狀態(tài)通常用于表示二進制數(shù)碼中的0和1。
    的頭像 發(fā)表于 08-12 11:01 ?207次閱讀

    TPA3112/TPA3116通過兩個引腳GAIN01控制增益,可以將這兩個引腳懸空可靠嗎?

    TPA3112TPA3116款D類功放芯片通過兩個引腳GAIN01控制增益。實際使用TPA3112時發(fā)現(xiàn)將引腳懸空也能起到給高電平的功能,但是芯片手冊沒有說明,實際運用的時候?qū)?/div>
    發(fā)表于 08-12 07:09

    雙穩(wěn)態(tài)電路的兩個穩(wěn)定狀態(tài)是什么

    兩個不同的狀態(tài)之一。這兩個狀態(tài)通常被稱為“高電平”和“低電平”,或者“0”和“1”。當(dāng)外部輸入信號作用于雙穩(wěn)態(tài)電路時,電路可以從一穩(wěn)定狀態(tài)切換到另一
    的頭像 發(fā)表于 08-11 15:00 ?427次閱讀

    XTR300、XTR305這兩個芯片是否可以相互替換?

    XTR300,XTR305,這兩個芯片是否可以相互替換?
    發(fā)表于 08-05 07:07

    請問ad9171的兩個輸出端口是否支持同時輸出兩個不同的頻率?

    你好,關(guān)于AD9171芯片我有一問題 ,數(shù)據(jù)手冊顯示該芯片具有兩個輸出通道,芯片內(nèi)部有DAC0和DAC1共
    發(fā)表于 05-28 06:20

    怎么讓工程中同時存在兩個ioc文件?

    你好,我現(xiàn)在需要在一工程中兼容兩個不同的項目,這兩個項目有不同的配置文件,請問可否讓兩個ioc
    發(fā)表于 05-23 07:50

    400MWh!金灣這兩個儲能項目開工!

    400MWh!金灣這兩個儲能項目開工! 珠海首個集中式儲能電站 珠海最大的儲能電站 珠海最大工商業(yè)儲能項目之一 ... ... 近日,金灣集
    的頭像 發(fā)表于 03-21 18:20 ?956次閱讀
    400MWh!金灣<b class='flag-5'>這兩個</b>儲能<b class='flag-5'>項目</b>開工!

    放大器器件手冊上為什么會有MAG和MSG這兩個指標呢?

    需要外匹配的管子的手冊上,經(jīng)常會有MAG和MSG這兩個指標。
    的頭像 發(fā)表于 03-18 18:21 ?2794次閱讀
    放大器器件手冊上為什么會有MAG和MSG<b class='flag-5'>這兩個</b>指標呢?

    小白請問電路里這兩個半圓代表什么?

    請問電路里這兩個半圓代表什么元件? 沒有搜到呀。 另外,請問下圖中的3.3v 電源是不是都要接到一起. 謝謝
    發(fā)表于 02-16 16:32

    如何給C語言中的函數(shù)定義兩個不同的名字?

    最近有位哥問我,如何給C語言中的函數(shù)定義兩個不同的名字?就是這兩個名字都是指向同一函數(shù),同一地址,而且兩個名字都可以當(dāng)做函數(shù)來用的那種。
    的頭像 發(fā)表于 12-19 16:21 ?562次閱讀

    AD7793使用內(nèi)部基準源,芯片的REF+、REF-這兩個管腳怎么接,直接懸空嗎?

    最近使用AD7793設(shè)計一款監(jiān)測設(shè)備的采集電路,請問如果我使用內(nèi)部基準源的話,那么芯片的REF+、REF-這兩個管腳怎么接,直接懸空嗎?在使用內(nèi)部基準源的時候還有沒有其他要注意的地方!謝謝!
    發(fā)表于 12-18 07:57

    零歐姆電阻器額定功率如何計算?注意,這兩個參數(shù)很關(guān)鍵!

    零歐姆電阻器額定功率如何計算?注意,這兩個參數(shù)很關(guān)鍵!
    的頭像 發(fā)表于 12-05 17:29 ?606次閱讀
    零歐姆電阻器額定功率如何計算?注意,<b class='flag-5'>這兩個</b>參數(shù)很關(guān)鍵!

    電源這兩個參數(shù)值,你有誤讀過嗎?

    電源這兩個參數(shù)值,你有誤讀過嗎?
    的頭像 發(fā)表于 11-27 16:33 ?295次閱讀

    請問OP37S和AD574S這兩個宇航級型號的結(jié)溫(Junction Temperature)范圍是多少?

    請問OP37S和AD574S這兩個宇航級型號的結(jié)溫(Junction Temperature)最大范圍是多少?
    發(fā)表于 11-21 08:17