日韩在线一区天天看,日本国产在线观看

電子發(fā)燒友網(wǎng)報道（文/李彎彎）7月30日消息，蘋果公司周一在一篇技術(shù)論文中表示，支撐其人工智能系統(tǒng)Apple Intelligence的兩個人工智能模型是在谷歌設(shè)計的云端芯片上進行預(yù)訓(xùn)練的。這表明，在訓(xùn)練尖端人工智能方面，大型科技公司正在尋找英偉達以外的替代品。

不斷迭代的谷歌TPU芯片

隨著機器學(xué)習(xí)算法，特別是深度學(xué)習(xí)算法在各個領(lǐng)域的廣泛應(yīng)用，對于高效、低功耗的AI計算硬件需求日益增長。傳統(tǒng)的CPU和GPU在處理這些算法時存在效率較低的問題，促使谷歌等科技巨頭開始探索專用AI加速芯片的研發(fā)。

谷歌在2015年左右開始規(guī)劃開發(fā)新的專用架構(gòu)處理器，旨在優(yōu)化機器學(xué)習(xí)算法中的張量運算執(zhí)行過程。經(jīng)過快速迭代和研發(fā)，谷歌于2016年發(fā)布了首個TPU版本（TPU v1），專門用于大規(guī)模機器學(xué)習(xí)加速。

TPU v1部署于數(shù)據(jù)中心，用于加速神經(jīng)網(wǎng)絡(luò)的推理階段。擁有65536個8-bit MAC（矩陣乘單元），峰值性能為92 TOPS（每秒萬億次操作），以及28 MiB的片上內(nèi)存空間。相比于CPU和GPU，TPU v1在響應(yīng)時間和能效比上表現(xiàn)出色，能夠顯著提升神經(jīng)網(wǎng)絡(luò)的推理速度。

隨著技術(shù)的不斷進步，谷歌相繼推出了多個TPU版本，不斷提升性能和功能。例如，TPU v2和TPU v3被設(shè)計為服務(wù)端AI推理和訓(xùn)練芯片，支持更復(fù)雜的AI任務(wù)。TPU v4則進一步增強了擴展性和靈活性，支持大規(guī)模AI計算集群的構(gòu)建。

在面對爭議和質(zhì)疑后，谷歌推出了TPU v5e版本。TPU v5e在架構(gòu)上進行了調(diào)整，采用單TensorCore架構(gòu)，并在INT8峰值算力上有所提升。盡管在BF16峰值算力上略低于前代版本，但TPU v5e更適用于推理任務(wù)，并體現(xiàn)了谷歌在AI算力服務(wù)市場的戰(zhàn)略選擇。

在今年5月的I/O開發(fā)者大會上，谷歌又發(fā)布了第六代張量處理單元 (TPU) ，稱為Trillium。Trillium TPU 可以更快地訓(xùn)練下一波基礎(chǔ)模型，并以更少的延遲和更低的成本為這些模型提供服務(wù)。至關(guān)重要的是，Trillium TPU 的能效比 TPU v5e 高出 67% 以上。

值得一提的是，Trillium 可以在單個高帶寬、低延遲 Pod 中擴展到多達 256 個 TPU。除了這種 Pod 級可擴展性之外，借助多切片技術(shù)和Titanium 智能處理單元 (IPU )，Trillium TPU 還可以擴展到數(shù)百個 Pod，從而連接建筑物級超級計算機中的數(shù)萬個芯片，這些芯片通過每秒數(shù) PB 的速度互連數(shù)據(jù)中心網(wǎng)絡(luò)。

谷歌表示，Trillium TPU 將為下一波 AI 模型和代理提供動力，包括自動駕駛汽車公司Nuro、藥物發(fā)現(xiàn)公司Deep Genomics、德勤等企業(yè)也采用其TPU產(chǎn)品進行應(yīng)用。

越來越多企業(yè)使用谷歌TPU芯片滿足AI計算

據(jù)谷歌官方信息，其最新TPU的運行成本每小時不足2美元，但客戶需提前三年預(yù)訂以確保使用。自2015年專為內(nèi)部工作負載設(shè)計的TPU問世以來，谷歌于2017年將其向公眾開放，如今，TPU已成為人工智能領(lǐng)域最為成熟和先進的定制芯片之一。

谷歌在其多個設(shè)施中使用了自研的TPU（Tensor Processing Unit）芯片。谷歌云平臺廣泛使用了TPU芯片來支持其AI基礎(chǔ)設(shè)施。這些芯片被用于加速機器學(xué)習(xí)模型的訓(xùn)練和推理過程，提供高性能和高效的計算能力。通過谷歌云平臺，用戶可以訪問到基于TPU芯片的虛擬機實例（VM），用于訓(xùn)練和部署自己的機器學(xué)習(xí)模型。

除此之外，已經(jīng)有多家公司使用谷歌的TPU芯片，如蘋果，蘋果在最新發(fā)表的技術(shù)論文中承認，公司采用了谷歌張量處理單元（TPU）訓(xùn)練其人工智能模型。

在周一發(fā)布的技術(shù)論文中，蘋果詳細介紹為支持蘋果個人智能化系統(tǒng)Apple Intelligence而開發(fā)了一些基礎(chǔ)語言模型，包括一個用于在設(shè)備上高效運行的約30億參數(shù)模型——端側(cè)“蘋果基礎(chǔ)模型”（AFM），以及一個為蘋果云端AI架構(gòu)“私有云計算”（Private Cloud Compute）而設(shè)計的大型服務(wù)器語言模型——服務(wù)器AFM。

蘋果披露，訓(xùn)練模型采用了谷歌研發(fā)的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。蘋果在8192塊TPUv4 芯片上從無到有訓(xùn)練服務(wù)器AFM，使用4096的序列長度和4096個序列的批量大小，進行6.3萬億token訓(xùn)練。端側(cè)AFM在2048塊TPUv5p芯片上進行訓(xùn)練。

此外，Anthropic這家被譽為“OpenAI勁敵”的人工智能初創(chuàng)公司，據(jù)悉是谷歌TPU芯片的早期用戶之一。Anthropic使用谷歌Cloud TPU v5e芯片為其大語言模型（LLM）Claude提供硬件支持，以加速模型的訓(xùn)練和推理過程。Hugging Face和AssemblyAI這兩家同樣在人工智能領(lǐng)域備受矚目的初創(chuàng)公司也在大規(guī)模使用谷歌TPU芯片來支持其AI應(yīng)用。

另外，許多科研機構(gòu)也在使用谷歌TPU芯片來支持其AI相關(guān)的研究項目。這些機構(gòu)可以利用TPU芯片的高性能計算能力來加速實驗過程，推動科研進展。一些教育機構(gòu)也將谷歌TPU芯片用于教學(xué)和培訓(xùn)目的，幫助學(xué)生和研究人員學(xué)習(xí)和掌握機器學(xué)習(xí)技術(shù)。

寫在最后

長期以來，英偉達的高性能GPU在高端人工智能模型訓(xùn)練市場占據(jù)主導(dǎo)地位，包括OpenAI、微軟、Anthropic在內(nèi)的多家科技公司紛紛采用其GPU來加速模型訓(xùn)練。但在過去幾年里，英偉達GPU始終供不應(yīng)求，為此谷歌、Meta、甲骨文及特斯拉等企業(yè)都在自研芯片，以滿足各自人工智能系統(tǒng)與產(chǎn)品開發(fā)的需求。

不僅如此，如谷歌，雖然TPU最初是為內(nèi)部工作負載而創(chuàng)建，而其憑借著諸多優(yōu)勢，現(xiàn)在正得到更廣泛的應(yīng)用。隨著人工智能技術(shù)的不斷發(fā)展和市場的不斷擴大，未來可能會有更多的企業(yè)選擇使用谷歌TPU芯片來滿足其AI計算需求。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6128

瀏覽量
104948
蘋果

蘋果

+關(guān)注

關(guān)注
61

文章
24336

瀏覽量
195556
TPU

TPU

+關(guān)注

關(guān)注
0

文章
138

瀏覽量
20684

【算能RADXA微服務(wù)器試用體驗】+ GPT語音與視覺交互：2，圖像識別

/download.sh 下載完成后，應(yīng)該可以看到文件夾中出現(xiàn)以下模型： ./models ├── BM1684 │├── yolov8s_fp32_1b.bmodel# 使用TPU-MLIR編譯，用于

發(fā)表于 07-14 23:36

谷歌發(fā)布第六代TPU芯片Trillium，挑戰(zhàn)GPT-4o

分析人士認為，谷歌積極推進自主研發(fā)芯片，按照其規(guī)劃，第七代和第八代產(chǎn)品將分別與聯(lián)發(fā)科、世芯合作生產(chǎn)。此次第六代TPU的推出，有望引領(lǐng)CSP（云端服務(wù)提供商）廠商投入自研芯片領(lǐng)域。

發(fā)表于 05-16 18:05 ?1316次閱讀

谷歌推出Trillium AI芯片，性能提高近5倍

谷歌推出了其最新的人工智能數(shù)據(jù)中心芯片——Trillium。這款芯片是谷歌的第六代產(chǎn)品，與上一代TPU v5e相比，

發(fā)表于 05-16 10:39 ?697次閱讀

谷歌將推出第六代數(shù)據(jù)中心AI芯片Trillium TPU

在今日舉行的I/O 2024開發(fā)者大會上，谷歌公司震撼發(fā)布了其第六代數(shù)據(jù)中心AI芯片——Trillium Tensor處理器單元（TPU）。

發(fā)表于 05-15 11:18 ?576次閱讀

Groq推出大模型推理芯片超越了傳統(tǒng)GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統(tǒng)GPU和谷歌TPU。

發(fā)表于 02-26 10:24 ?939次閱讀

Groq推出大模型推理芯片超越了傳統(tǒng)GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

tpu材料的用途和特點

的制作，例如鞋底、鞋面、鞋墊等。TPU具有耐磨、抗刮擦、柔軟舒適等特點，可以為鞋提供良好的保護和舒適性。服裝行業(yè)：TPU材料在服裝行業(yè)中應(yīng)用廣泛，常用于雨衣、防水服、防寒服

發(fā)表于 01-16 10:17 ?2989次閱讀

TPU是什么材料做的

制得的高分子材料。TPU材料于20世紀(jì)60年代開始使用，并逐漸發(fā)展成為一種廣泛應(yīng)用于工業(yè)領(lǐng)域的彈性體材料。 TPU的結(jié)構(gòu)和性能 1.結(jié)構(gòu)：TPU材料由醇類元組成，醇對材料的強度、硬度和

發(fā)表于 01-12 13:40 ?3003次閱讀

TPU-MLIR開發(fā)環(huán)境配置時出現(xiàn)的各種問題求解

按照 TPU-MLIR 開發(fā)指南進行環(huán)境配置： 2.1. 代碼下載? 代碼路徑: https://github.com/sophgo/tpu-mlir 克隆該代碼后, 需要在Docker中編譯

發(fā)表于 01-10 08:02

谷歌TPU v5p超越Nvidia H100，成為人工智能領(lǐng)域的競爭對手

TPU v5p已在谷歌“AI超級計算機”項目中發(fā)揮重要作用，這并非專業(yè)科研型超算平臺，而是面向各類人工智能應(yīng)用。與Nvidia開放GPU購買

發(fā)表于 12-26 15:20 ?1995次閱讀

谷歌最強大的定制設(shè)計人工智能加速器—TPU v5p芯片

谷歌正迅速成為 BFF Nvidia 的強大對手——為其超級計算機提供動力的 TPU v5p AI 芯片速度更快，內(nèi)存和帶寬比以往任何時候都

發(fā)表于 12-26 09:31 ?1833次閱讀

深入學(xué)習(xí)和掌握TPU硬件架構(gòu)有困難？TDB助力你快速上手！

TDB介紹TDB(TPUDeBugger)是針對TPU-MLIR編譯出來的BModel設(shè)計的一系列調(diào)試工具集合,可以支持對BModel反匯編、結(jié)構(gòu)可視化、單步執(zhí)行仿真等功能，使用方法靈活。能夠

發(fā)表于 12-22 08:33 ?623次閱讀

深入學(xué)習(xí)和掌握<b class='flag-5'>TPU</b>硬件架構(gòu)有困難？TDB助力你快速上手！

CPU與GPU與TPU之間有什么區(qū)別？

CPU與GPU與TPU之間有什么區(qū)別？ CPU（Central Processing Unit，中央處理器）是一種通用處理器，被用于各種計算任務(wù)，如操作系統(tǒng)運行、數(shù)據(jù)處理、算法運算等。它是計算

發(fā)表于 12-15 10:10 ?6484次閱讀

谷歌發(fā)布多模態(tài)Gemini大模型及新一代TPU系統(tǒng)Cloud TPU v5p

谷歌亦發(fā)布新一代TPU 系統(tǒng)——Cloud TPU v5p，以幫助訓(xùn)練尖端的 AI 模型。目

發(fā)表于 12-12 10:50 ?1279次閱讀

成都匯陽投資關(guān)于谷歌攜 Gemini 王者歸來，AI 算力和應(yīng)用值得期待

“Cloud TPU v5p”, 以及來自谷歌云的人工智能超級計算機。本次谷歌推出的多模態(tài)大模型Gemini 依然采用Transform

發(fā)表于 12-11 14:40 ?853次閱讀

Google的第五代TPU，推理性能提升2.5倍

　Gridspace 機器學(xué)習(xí)主管Wonkyum Lee表示：“我們的速度基準(zhǔn)測試表明，在 Google Cloud TPU v5e 上訓(xùn)練和運行時，AI 模型的速度提高了 5 倍。我們還看到推理

發(fā)表于 11-24 10:27 ?555次閱讀

搜索歷史

從TPU v1到Trillium TPU，蘋果等科技公司使用谷歌TPU進行AI計算

評論