0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Dojo對(duì)標(biāo)A100性能強(qiáng)勁,AI應(yīng)用場(chǎng)景拓展

智能計(jì)算芯世界 ? 來(lái)源:智能計(jì)算芯世界 ? 2023-09-23 09:45 ? 次閱讀

D1 芯片對(duì)標(biāo)英偉達(dá) A100。D1采用臺(tái)積電 7nm 制程,面積約為 645mm2,包含 500 億顆晶體管,BF16、CFP8 算力可達(dá) 362TFLOPS,F(xiàn)P32 算力可達(dá) 22.6TFLOPS。特斯拉D1芯片對(duì)標(biāo)英偉達(dá) A100,英偉達(dá) A100 同樣采用臺(tái)積電 7nm 制程,面積為 826mm2,晶體管數(shù)量達(dá) 542 億顆,F(xiàn)P32 峰值算力為 19.5TFLOPS。

59ad8a8e-59a0-11ee-939d-92fbcf53809c.png

D1 芯片依次組成 Tranining tile、Tray、機(jī)柜、ExaPOD。特斯拉并未將 SoC 從晶圓上切下來(lái),而是將所有 SoC 連接。25 個(gè) D1 芯片組成了一個(gè) Training Tile 多晶片模組(MCM),每個(gè) D1 芯片功耗 400W,一個(gè) Training Tile 功耗為 15kW。此外,6 個(gè) Training Tile 組成一個(gè) tray,再由兩個(gè) Tray 組成一個(gè)機(jī)柜,10 個(gè)機(jī)柜組成 ExaPOD,BF16/CFP8 峰值算力達(dá)到 1.1EFLOPS(百億億次浮點(diǎn)運(yùn)算),并擁有 1.3TB 高速 SRAM 和 13TB 高帶寬 DRAM

59cb210c-59a0-11ee-939d-92fbcf53809c.png

59f03168-59a0-11ee-939d-92fbcf53809c.png

Dojo 的設(shè)計(jì)思想是通過(guò)較高的對(duì)稱(chēng)性來(lái)實(shí)現(xiàn) scale out 能力。在單個(gè) Training tile 上,由于并未將芯片切下,為了提高效率和降低成本,特斯拉并未在片上集成 DRAM 等器件,這與許多通用 GPU 有所不同。集群節(jié)點(diǎn)之間以 2D mesh 連接,邊緣則通過(guò) Interface-processors負(fù)責(zé)內(nèi)存池?cái)?shù)據(jù)搬運(yùn)。

5a1509c0-59a0-11ee-939d-92fbcf53809c.png

顯而易見(jiàn),D1 芯片需要高速的互聯(lián)來(lái)實(shí)現(xiàn),臺(tái)積電 SoW 封裝技術(shù)提供了這一條件。InFO_SoW 取消了襯底和 PCB 的使用,使得多個(gè)芯片陣列使解決方案獲得晶圓級(jí)優(yōu)勢(shì),以獲得低延時(shí)、高帶寬等優(yōu)勢(shì)。此外除了異構(gòu)芯片集成外,其 wafer-field 處理能力還支持基于小芯片的設(shè)計(jì),以實(shí)現(xiàn)更大的成本節(jié)約和設(shè)計(jì)靈活性。

5a35090a-59a0-11ee-939d-92fbcf53809c.png

在部分模型上,Dojo 能實(shí)現(xiàn)相對(duì) A100 更高的性能。例如在圖像分類(lèi)模型 ResNet-50 上,Dojo 可以實(shí)現(xiàn)比英偉達(dá) A100 更高的幀率。而在用于預(yù)測(cè)汽車(chē)周?chē)矬w所占空間的神經(jīng)網(wǎng)絡(luò)模型 Occupancy Networks 上,相比英偉達(dá) A100,Dojo 能實(shí)現(xiàn)性能的倍增。

5a55532c-59a0-11ee-939d-92fbcf53809c.png

特斯拉將大力投資基礎(chǔ)設(shè)施,2024 年有望達(dá) 100Exa-Flops 算力。特斯拉目前 AI 基礎(chǔ)設(shè)施較少,僅約 4000 個(gè) V100 和約 16000 個(gè) A100。而 Microsoft 和 Meta 等公司擁有超過(guò) 10萬(wàn)個(gè) GPU。據(jù)特斯拉規(guī)劃,2024 年有望達(dá) 100Exa-Flops 算力。

特斯拉擁有海量數(shù)據(jù)庫(kù),數(shù)據(jù)價(jià)值亟待挖掘。Model3 傳包含 8 個(gè)攝像頭,1 個(gè)毫米波雷達(dá),12 個(gè)超聲波雷達(dá),位置分別為:1-車(chē)牌的上方裝有一個(gè)攝像頭;2-超聲波傳感器(如果配備)位于前后保險(xiǎn)杠中;3-各門(mén)柱均裝有一個(gè)攝像頭;4-后視鏡上方的擋風(fēng)玻璃上裝有三個(gè)攝像頭;5-每塊前翼子板上裝有一個(gè)攝像頭;6-雷達(dá)(如果配備)安裝在前保險(xiǎn)杠后面。特斯拉車(chē)型銷(xiāo)量形勢(shì)良好,通過(guò)傳感器件建立了龐大的數(shù)據(jù)庫(kù),但受限于硬件限制,無(wú)法充分挖掘數(shù)據(jù)價(jià)值,Dojo 量產(chǎn)有望突破瓶頸。

自建 AI 基礎(chǔ)設(shè)施,AI 或賦能特斯拉快速成長(zhǎng)。特斯拉 Dojo 性能強(qiáng)大,我們認(rèn)為,除加速自身智駕進(jìn)程外,或可拓展至其他應(yīng)用領(lǐng)域,如機(jī)器人等。此外,特斯拉也可能成為一家云服務(wù)提供商,向相關(guān)廠商提供自身算力或模型服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2541

    文章

    49958

    瀏覽量

    747468
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • 毫米波雷達(dá)
    +關(guān)注

    關(guān)注

    105

    文章

    1011

    瀏覽量

    63986

原文標(biāo)題:Dojo對(duì)標(biāo)A100性能強(qiáng)勁,AI應(yīng)用場(chǎng)景拓展

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英偉達(dá)a100和h100哪個(gè)強(qiáng)?英偉達(dá)A100和H100的區(qū)別

    英偉達(dá)a100和h100哪個(gè)強(qiáng)? 就A100和H100這兩個(gè)產(chǎn)品來(lái)說(shuō),它們雖然都是英偉達(dá)公司的高性能計(jì)算產(chǎn)品,但是面向的市場(chǎng)和應(yīng)
    的頭像 發(fā)表于 08-09 17:31 ?4.6w次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算
    發(fā)表于 03-12 08:09

    新一代AI ISP視頻處理模組,對(duì)標(biāo)Hi3559A、Hi3519A平臺(tái)性能

    照度全彩視頻處理模組SOM928及配套的IVP928智能視頻處理開(kāi)發(fā)套件,對(duì)標(biāo)Hi3559A、Hi3519A平臺(tái)性能;除了同樣優(yōu)秀的編解碼能力外,更擁有關(guān)鍵的
    發(fā)表于 06-07 15:12

    NVIDIA推出了基于A100的DGX A100

    在發(fā)布A100 80GB加速卡之后,NVIDIA也更新了自家的DGX A100產(chǎn)品線,最多可達(dá)640GB HBM2e顯存了。此外,還有全新的DGX Station A100工作站,配備了4個(gè)A
    的頭像 發(fā)表于 11-17 10:26 ?4236次閱讀

    英偉達(dá)a100和h100哪個(gè)強(qiáng)?

    英偉達(dá)a100和h100哪個(gè)強(qiáng)? 英偉達(dá)A100比H100更強(qiáng)。英偉達(dá)A100在處理大型模型和數(shù)據(jù)集時(shí)可能比V
    的頭像 發(fā)表于 08-07 17:32 ?1.4w次閱讀

    英偉達(dá)a100a800的區(qū)別

    的浮點(diǎn)性能為19.5 TFLOPS,而A800為10.6 TFLOPS。 3. 存儲(chǔ)容量不同:A100的顯存最大為80 GB,而A800為48 GB。 4.
    的頭像 發(fā)表于 08-07 17:57 ?4.1w次閱讀

    英偉達(dá)a100a800參數(shù)對(duì)比

    | | 尺寸(L x H) | 26.7 x 11.2 cm | 26.7 x 11.2 cm | | 適用領(lǐng)域 | AI、機(jī)器學(xué)習(xí)、高性能計(jì)算 | 虛擬桌面、虛擬應(yīng)用、多媒體、游戲 | 總體而言,A100的核心數(shù)量
    的頭像 發(fā)表于 08-07 18:00 ?1.2w次閱讀
    英偉達(dá)<b class='flag-5'>a100</b>和<b class='flag-5'>a</b>800參數(shù)對(duì)比

    英偉達(dá)A100和3090的區(qū)別

    英偉達(dá)A100和3090的區(qū)別 英偉達(dá)A100是一款面向數(shù)據(jù)中心的計(jì)算加速器,其主要優(yōu)勢(shì)是支持?jǐn)?shù)據(jù)中心最新的AI、機(jī)器學(xué)習(xí)和高性能計(jì)算工作負(fù)載。它配備了專(zhuān)門(mén)的張量核心和加速器,可以比普
    的頭像 發(fā)表于 08-07 18:54 ?3992次閱讀

    英偉達(dá)A100和4090的區(qū)別

    英偉達(dá)A100和4090的區(qū)別 英偉達(dá)A100和4090都是英偉達(dá)的高性能計(jì)算卡型號(hào)。它們之間的主要區(qū)別在于: 1. 架構(gòu):英偉達(dá)A100采用的是Ampere架構(gòu),而4090采用的是V
    的頭像 發(fā)表于 08-08 11:59 ?2.9w次閱讀

    英偉達(dá)A100是什么系列?

    被暴搶。 英偉達(dá)A100是英偉達(dá)推出的一款數(shù)據(jù)中心GPU系列,采用了全新的Ampere架構(gòu)。它是一款專(zhuān)為深度學(xué)習(xí)、科學(xué)計(jì)算、超級(jí)計(jì)算等工作負(fù)載設(shè)計(jì)的高性能計(jì)算解決方案,擁有更高的計(jì)算能力、更大的顯存容量和更快的數(shù)據(jù)傳輸速度等優(yōu)勢(shì)。 英偉達(dá)
    的頭像 發(fā)表于 08-08 15:13 ?2887次閱讀

    英偉達(dá)A100的簡(jiǎn)介

    達(dá)A100是英偉達(dá)公司推出的一款面向高性能計(jì)算(HPC)和人工智能(AI)的加速計(jì)算卡。它采用了全球首個(gè)基于7nm工藝的數(shù)據(jù)中心GPU架構(gòu)Ampere,擁有6912個(gè)CUDA核心和432個(gè)張量核心
    的頭像 發(fā)表于 08-08 15:17 ?8668次閱讀

    英偉達(dá)A100的優(yōu)勢(shì)分析

    HBM2顯存。 英偉達(dá)A100是一款高性能的GPU,其主要優(yōu)勢(shì)如下: 1. 支持高效的AI計(jì)算:A100采用了新一代的Tensor Core技術(shù),能夠在
    的頭像 發(fā)表于 08-08 15:25 ?3120次閱讀

    英偉達(dá)a100有國(guó)產(chǎn)替代嗎?

    和昇騰920芯片均具有AI處理能力。另外,國(guó)內(nèi)企業(yè)紫光展銳、寒武紀(jì)等也在不斷推出性能與英偉達(dá)A100相近的AI芯片。雖然目前這些芯片還無(wú)法完全替代英偉達(dá)
    的頭像 發(fā)表于 08-08 15:37 ?4219次閱讀

    英偉達(dá)v100A100的差距有哪些?

    英偉達(dá)v100A100的差距有哪些? 在當(dāng)今人工智能和深度學(xué)習(xí)技術(shù)日益發(fā)展的時(shí)代,高性能計(jì)算機(jī)顯卡已成為支持這些技術(shù)發(fā)展的關(guān)鍵。英偉達(dá)是高性能計(jì)算機(jī)顯卡領(lǐng)域的領(lǐng)導(dǎo)者之一,其v
    的頭像 發(fā)表于 08-22 16:46 ?2.1w次閱讀

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場(chǎng)景等多個(gè)方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?2741次閱讀