0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最被看好的 AI 芯片初創(chuàng)公司之一,Tenstorrent加速卡出貨

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-01-04 00:04 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))在 CRN 發(fā)布的 2023 年十大半導(dǎo)體初創(chuàng)公司的名單上,我們看到了不少AI 芯片廠商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人關(guān)注,這家位于多倫多的初創(chuàng)企業(yè)如今由知名半導(dǎo)體業(yè)界大神 Jim Keller擔(dān)任CEO。

Tenstorrent 在 2021 年收獲了富達(dá)集團(tuán)領(lǐng)投的 2 億美元融資后,又在2023 年獲得了來自現(xiàn)代汽車集團(tuán)和三星催化劑基金會領(lǐng)投的 1 億美元融資。但對于這家廠商的硬件產(chǎn)品,我們卻很少得見真容,直到最近其開發(fā)套件開放訂購和出貨。

開發(fā)套件出貨,新的 AI 硬件開發(fā)平臺

從 Tenstorrent 的官網(wǎng)來看,目前已經(jīng)開放訂購的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,兩者的定價分別為 599 美元和 799 美元。e75 開發(fā)套件可用于基礎(chǔ)的推理任務(wù),采用了 1/2 PCIe長度的設(shè)計搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 個 Tensix 核心、96MB 的 SRAM、8GB LPDDR4 內(nèi)存,核心頻率達(dá)到 1GHz,整個板卡的功耗約為75W。

e150 則是 3/4 長度的 PCIe 加速卡,同樣搭載了一個 Grayskull 芯片,但核心數(shù)卻達(dá)到了 120個,同時配備了120MB 的 SRAM,核心頻率也提升至 1.2GHz,單卡功耗約為 200W.

e75 雖然只是入門級的推理硬件套件,卻已經(jīng)給到了完整的開發(fā)流程,開發(fā)者可以使用兩種不同的軟件實現(xiàn)方式,一套是從上至下的 TT-Buda,另一套是從下至上的TT-Metalium。TT-Buda適用于想要開箱即用,直接將任何模型投入量產(chǎn)的客戶。而TT-Metalium則適用于想要充分了解 Tenstorrent軟硬件,并借此定制開發(fā)模型的客戶。

需要注意的是,e75 和 e150僅僅是 AI 加速卡而已,仍需要搭配一套通用計算系統(tǒng)才能精心開展 AI 開發(fā)。目前其僅支持 x86_64 架構(gòu)和 Ubuntu 20.04 以上版本的系統(tǒng),且需要 64GB 的內(nèi)存和至少 100GB 的存儲。

Tenstorrent 下一代 AI 芯片

除了第一代芯片 Grayskull 以外,Tenstorrent也公開了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭載了一個 Wormhole 芯片,而 n300 搭載了兩個 Wormhole 芯片,因此兩者的 Tensix 核心數(shù)存在較大差異,分別是 72 個和 128 個,單板功耗分別為 160W和 300W。

從內(nèi)存配置上看,Wormhole也確實是面向更高性能的 AI 解決方案,將 Grayskull 的 LPDDR4 內(nèi)存換成了帶寬更高的 GDDR6 內(nèi)存。根據(jù)Tenstorrent 提供的說明,GraySkull 和 Wormhole 已經(jīng)支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更強(qiáng)的 Wormhole還提供了對 Falcon 和 Stable Diffusion 的支持。

不過,與可以單獨(dú)購買單個開發(fā)套件的 e75 和 e150 相比,目前 n150 和 n300 只開放了批量購買,且并沒有公布定價。要知道,無論是 Grayskull還是 Wormhole,都只是 Tenstorrent對 AI 芯片的早期設(shè)計與嘗試,兩者均基于 12nm 工藝開發(fā),且實際算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件資源配置上有些許不同。而后續(xù)即將推出的 Black Hole將基于 6nm 工藝打造,將算力提升至1000TFLOPS@INT8 左右。

在其產(chǎn)品路線圖上,預(yù)計在今年公開發(fā)布的 Grendel才是其針對高端 AI 計算的殺手锏。Grendel采用了全新的 Chiplet 設(shè)計,且用到了自研的 RISC-V CPU 核心,結(jié)合 3nm 工藝的 AI&CPU Chiplet,以及 7nm 工藝的內(nèi)存與 I/O Chiplet,將提供一個完整可擴(kuò)展的 AI 硬件平臺。

寫在最后

對于任何一個新的 AI 開發(fā)平臺而言,硬件開發(fā)套件和配套軟件都是至關(guān)重要的,甚至決定了愿意嘗試的開發(fā)者基數(shù)。Tenstorrent 在開放了 e75 和e150的購買后,無疑給不少還在觀望其硬件架構(gòu)的開發(fā)一個嘗鮮的機(jī)會。而開箱即用的體驗,想必也會吸引不少廠商對后續(xù)的高性能產(chǎn)品產(chǎn)生興趣。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
  • 加速卡
    +關(guān)注

    關(guān)注

    1

    文章

    56

    瀏覽量

    10928
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1850

    瀏覽量

    34849
  • Tenstorrent
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    133
收藏 人收藏

    評論

    相關(guān)推薦

    Tenstorrent與日本合作:五年內(nèi)培訓(xùn)200名日本芯片工程師

    美國人工智能(AI芯片初創(chuàng)公司Tenstorrent近日宣布,已與日本政府達(dá)成了項重要協(xié)議。
    的頭像 發(fā)表于 11-06 14:30 ?262次閱讀

    AMD推出新款纖薄尺寸電子交易加速卡

    UL3422 為交易商、做市商和金融機(jī)構(gòu)提供了款針對機(jī)架空間和成本進(jìn)行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務(wù)器中。
    的頭像 發(fā)表于 10-16 09:14 ?372次閱讀

    大模型向邊端側(cè)部署,AI加速卡朝高算力、小體積發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI加速卡是專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊。它集成了高性能的計算核心和大量的內(nèi)存,旨在加速機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法的計算過程。當(dāng)前,AI
    的頭像 發(fā)表于 09-17 00:18 ?2863次閱讀

    EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是種專為加速人工智能(
    發(fā)表于 09-10 14:56 ?0次下載

    YXC高頻差分晶振,頻點(diǎn)312.5mhz,高精度.高穩(wěn)定性,應(yīng)用于AI加速卡

    AI加速卡中,揚(yáng)興推薦的YXC差分晶振YSO210PR系列,該系列頻率范圍為10MHz ~1500MHz,可滿足高精度、高穩(wěn)定度的需求,支持差分信號(LVDS/LVPECL)輸出,以下為YSO210PR系列中OA2EIBW
    的頭像 發(fā)表于 08-21 14:03 ?268次閱讀
    YXC高頻差分晶振,頻點(diǎn)312.5mhz,高精度.高穩(wěn)定性,應(yīng)用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    借助全新 AMD Alveo? V80 計算加速卡釋放計算能力

    靈活應(yīng)變能力以實現(xiàn)工作負(fù)載優(yōu)化。Alveo V80 加速卡現(xiàn)已量產(chǎn)出貨,其能提供較之上加速卡至高 2 倍的帶寬與計算密度1,并為使用 AMD Vivado? 設(shè)計套件的 FPGA
    發(fā)表于 05-16 14:09 ?193次閱讀
    借助全新 AMD Alveo? V80 計算<b class='flag-5'>加速卡</b>釋放計算能力

    AMD Alveo V80計算加速卡實現(xiàn)量產(chǎn)

    AMD公司近日迎來了個重要的里程碑,其專為大型數(shù)據(jù)集和內(nèi)存受限型應(yīng)用設(shè)計的Alveo V80計算加速卡,已正式進(jìn)入量產(chǎn)出貨階段。這款創(chuàng)新產(chǎn)品針對高性能計算(HPC)、數(shù)據(jù)分析、金融、
    的頭像 發(fā)表于 05-16 11:40 ?564次閱讀

    OpenAI Sora模型需大量AI加速卡及電力支持

    若以每片H100加速卡3萬美元市價估算,總花費(fèi)將高達(dá)216億美元(相當(dāng)于1561.68億元人民幣),這僅是H100加速卡采購費(fèi)用。該模型在運(yùn)營時還會產(chǎn)生極高的能耗,每片H100能耗達(dá)到700瓦,72萬片則意味著能耗高達(dá)50.4億瓦。
    的頭像 發(fā)表于 03-27 15:58 ?495次閱讀

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新AI圖形處理器架構(gòu)Blackwell,
    的頭像 發(fā)表于 03-20 11:38 ?1041次閱讀

    英偉達(dá)發(fā)布超強(qiáng)AI加速卡,性能大幅提升,可支持1.8萬億參數(shù)模的訓(xùn)練

    得益于NVIDIA每兩年進(jìn)行次GPU架構(gòu)升級以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更為強(qiáng)大,尤其適用于AI相關(guān)任務(wù)。
    的頭像 發(fā)表于 03-19 12:04 ?703次閱讀

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡GB200,開啟新AI圖形處理時代

    英偉達(dá)正式發(fā)布了其最新、也是迄今為止最強(qiáng)大的AI加速卡——GB200。這重大發(fā)布標(biāo)志著英偉達(dá)在AI圖形處理領(lǐng)域邁入了個新的里程碑。
    的頭像 發(fā)表于 03-19 11:26 ?1090次閱讀
    英偉達(dá)發(fā)布最強(qiáng)<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,開啟新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>圖形處理時代

    Tenstorrent將為日本LSTC新型邊緣2納米AI加速器開發(fā)芯片

    加拿大AI芯片領(lǐng)域的初創(chuàng)公司Tenstorrent與日本尖端半導(dǎo)體技術(shù)中心(LSTC)達(dá)成了
    的頭像 發(fā)表于 02-28 10:49 ?608次閱讀

    寧暢參與發(fā)布AI加速卡液冷設(shè)計白皮書

    近日,由寧暢參與起草的《基于標(biāo)準(zhǔn)PCIe接口的人工智能加速卡液冷設(shè)計》白皮書正式發(fā)布。該技術(shù)白皮書由開放計算標(biāo)準(zhǔn)工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設(shè)計提供重要指導(dǎo)。
    的頭像 發(fā)表于 01-09 11:28 ?720次閱讀

    瞬變對AI加速卡供電的影響

    ,尤其是在學(xué)習(xí)和推理時。這種需求不斷地將供電網(wǎng)絡(luò)的邊界推向前所未有的新水平。這些高密度工作負(fù)載變得愈加復(fù)雜,更高的瞬態(tài)需求推動配電網(wǎng)絡(luò)的每個部分都必須高效運(yùn)行。AI加速卡嚴(yán)格的功耗要求對系統(tǒng)性能也有影響。本文將討論AI
    的頭像 發(fā)表于 12-01 18:10 ?375次閱讀
    瞬變對<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供電的影響

    HPC領(lǐng)域的款大殺器-HBX-G500大帶寬加速卡

    HBX-G500是款高性能可編程加速卡,為AI、計算、網(wǎng)絡(luò)等領(lǐng)域,提供多通道的高帶寬存儲、高性能計算、先進(jìn)高速接口等解決方案;
    的頭像 發(fā)表于 11-29 09:16 ?927次閱讀
    HPC領(lǐng)域的<b class='flag-5'>一</b>款大殺器-HBX-G500大帶寬<b class='flag-5'>加速卡</b>