0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)AI遇上云原生,綠色算力助力開(kāi)啟AI新時(shí)代

安晟培半導(dǎo)體 ? 來(lái)源:安晟培半導(dǎo)體 ? 2023-02-24 11:23 ? 次閱讀

撰寫文章、編寫代碼、譜寫 Rap,上知天文,下知地理,十八般武藝樣樣精通……從 2022 年底開(kāi)始,一款由美國(guó)人工智能研究實(shí)驗(yàn)室 OpenAI 發(fā)布的自然語(yǔ)言處理工具 ChatGPT 備受關(guān)注,成為現(xiàn)象級(jí)的 AI 產(chǎn)品,掀起全球的 AI 浪潮。

在以 ChatGPT 為代表的 AI 應(yīng)用蓬勃發(fā)展的背后,離不開(kāi)數(shù)據(jù)中心提供的算力支撐。而隨著相關(guān)應(yīng)用的不斷發(fā)展,它們所需的算力將呈指數(shù)級(jí)增長(zhǎng),所需的能耗也不容小覷。根據(jù) 2021 年國(guó)外研究人員年發(fā)表的研究結(jié)果,部分基于 GPT-3 模型的訓(xùn)練共消耗1,287 兆瓦時(shí)電力,并產(chǎn)生了超過(guò)550 噸二氧化碳當(dāng)量的排放,這相當(dāng)于一個(gè)人往返紐約和舊金山550 次所消耗的二氧化碳量[1]。

Ampere Computing 一直致力于為數(shù)據(jù)中心帶來(lái)高性能、高能效的云原生處理器,助力減少環(huán)境足跡,構(gòu)建綠色數(shù)據(jù)中心,降低總體擁有成本(TCO),以更可持續(xù)的方式為用戶提供更多的綠色算力。在 AI 領(lǐng)域,Ampere 提供的 AI 解決方案具備卓越的推理性能和優(yōu)越的能效,幫助用戶輕松應(yīng)對(duì)算力及能耗的挑戰(zhàn)。

想知道 ChatGPT 如何看待AI 在“減碳”方面的作用嗎?快來(lái)參與文末的趣味互動(dòng)吧!

云原生設(shè)計(jì),強(qiáng)力賦能 AI 推理

Ampere Altra Max 基于高性能、高能效及可預(yù)測(cè)的創(chuàng)新架構(gòu),非常適合在云中執(zhí)行 AI 推理工作,不僅可以滿足延遲和吞吐量的要求,而且性能優(yōu)于基于 x86 架構(gòu)的 CPU。讓我們一起來(lái)看一下在 Ampere Altra Max 處理器上運(yùn)行 AI 推理的收益吧!

開(kāi)箱即用,暢享便捷體驗(yàn)

在 Ampere Altra Max 上運(yùn)行 AI 推理不需要修改或轉(zhuǎn)換已有神經(jīng)網(wǎng)絡(luò),即可在 TensorFlow、PyTorch 或 ONNX 框架上開(kāi)發(fā)和運(yùn)行 AI 推理的工作負(fù)載。用戶可從 Ampere 或 Ampere 云服務(wù)合作伙伴處免費(fèi)獲得優(yōu)化框架,高效地部署和運(yùn)行應(yīng)用程序。同時(shí),Ampere Altra Max 是目前唯一支持 fp16 數(shù)據(jù)格式,并已廣泛可用的云原生處理器,將 fp32 訓(xùn)練的網(wǎng)絡(luò)量化為 fp16 極為簡(jiǎn)單,且不會(huì)導(dǎo)致明顯的精度損失。

此外,Ampere 還提供一系列不斷優(yōu)化、預(yù)訓(xùn)練的模型,供用戶下載用于演示或在實(shí)際應(yīng)用程序中進(jìn)行調(diào)整并使用。并且,Ampere Altra Max CPU 還可與 NVIDIA GPU 協(xié)同工作,滿足用戶的訓(xùn)練需求。

高度可擴(kuò)展,有效抵抗干擾

憑借創(chuàng)新的可橫向擴(kuò)展架構(gòu),Ampere Altra Max 處理器具有更高的核心數(shù)和出色的單線程性能。結(jié)合所有內(nèi)核可同時(shí)一致頻率運(yùn)行的特性,Ampere Altra Max 的單 CPU 整體性能比目前最好的 x86 服務(wù)器更高、更穩(wěn)定,在多租戶的云環(huán)境中對(duì)“嘈雜鄰居”的干擾也更具抵抗力。

基準(zhǔn)測(cè)試,彰顯卓越推理性能

為展示 Ampere Altra Max CPU 在多個(gè)具有代表性的 AI 推理任務(wù)中的卓越性能,Ampere 按照 MLCommons 指南運(yùn)行了一系列基準(zhǔn)測(cè)試(包括計(jì)算機(jī)視覺(jué)和 NLP 應(yīng)用),部分測(cè)試的結(jié)果如下。

計(jì)算機(jī)視覺(jué)方面,使用 SSD ResNet-34 測(cè)試典型的對(duì)象檢測(cè)應(yīng)用,在 fp32 模式下與比較對(duì)象相比,Ampere Altra Max 在低延遲方面最高可領(lǐng)先近 4 倍。在 fp16 模式下,Altra Max 將領(lǐng)先優(yōu)勢(shì)擴(kuò)大了兩倍,同時(shí)保持了相同的精度。

52ae8e84-b371-11ed-bfe3-dac502259ad0.png

在性能功耗比方面,Ampere Altra Max 也具有顯著優(yōu)勢(shì)。在 fp16 分辨率下,Ampere Altra Max 的能效與比較對(duì)象相比高約 5 倍。而在 fp32 分辨率下,Ampere Altra Max 則擁有高約 2 倍的領(lǐng)先優(yōu)勢(shì)。

52d9a40c-b371-11ed-bfe3-dac502259ad0.png

面對(duì)蓬勃發(fā)展的 AI 應(yīng)用,Ampere AI 解決方案將為 AI 應(yīng)用和數(shù)據(jù)中心的發(fā)展提供更可持續(xù)的綠色算力支撐,助力解決不斷升級(jí)的算力需求和日益突出的環(huán)境問(wèn)題。一直以來(lái),Ampere 著眼未來(lái)、不斷創(chuàng)新,將卓越性能和能效融入到為云定制的解決方案中,助力釋放數(shù)字經(jīng)濟(jì)生產(chǎn)力,助推科技產(chǎn)業(yè)在可持續(xù)發(fā)展的道路上一路“狂飆”。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266236
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235022
  • 云原生
    +關(guān)注

    關(guān)注

    0

    文章

    238

    瀏覽量

    7919
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    836

    瀏覽量

    14573
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6933

原文標(biāo)題:創(chuàng)芯課堂|當(dāng) AI 遇上云原生,綠色算力助力開(kāi)啟 AI 新時(shí)代

文章出處:【微信號(hào):AmpereComputing,微信公眾號(hào):安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于Arm架構(gòu)的Azure虛擬機(jī)助力云原生應(yīng)用開(kāi)發(fā)

    定制芯片有助于解決現(xiàn)代基礎(chǔ)設(shè)施所面臨的計(jì)算挑戰(zhàn),例如人工智能 (AI) 時(shí)代與日俱增的計(jì)算復(fù)雜性。Microsoft Azure Cobalt 100 等采用 Arm Neoverse 計(jì)算
    的頭像 發(fā)表于 09-05 15:54 ?1449次閱讀

    開(kāi)啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    計(jì)算機(jī)學(xué)院牛建偉教授主持。 中科院軟件所副所長(zhǎng)、總工程師,武延軍研究員做了“AI大模型時(shí)代下的操作系統(tǒng)發(fā)展思考”主題演講。 武延軍介紹了操作系統(tǒng)的發(fā)展歷程,指出應(yīng)用的高速發(fā)展給操作系統(tǒng)帶來(lái)的
    發(fā)表于 08-30 17:24

    KubeCon China 2024全球大會(huì)在香港舉行,京東云受邀參加探討云原生、開(kāi)源及 AI

    和數(shù)字化大潮一樣,在AI化的革命下,云端也在全面擁抱AI,并在方方面面變得更安全、更高效,讓全球各行各業(yè)受益。2024年8月21日,由云原生計(jì)算基金會(huì)(CNCF)和?Linux?基金會(huì)聯(lián)合主辦
    的頭像 發(fā)表于 08-23 13:42 ?172次閱讀

    大模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    【書籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型中心建設(shè)指南

    章講解GPU板卡調(diào)度技術(shù);第8章講解GPU虛擬化調(diào)度方案;第9章講解GPU集群的網(wǎng)絡(luò)虛擬化設(shè)計(jì)與實(shí)現(xiàn);第10章講解GPU集群的存儲(chǔ)設(shè)計(jì)與實(shí)現(xiàn);第11章講解如何基于云原生技術(shù)為機(jī)器學(xué)習(xí)應(yīng)用設(shè)計(jì)與實(shí)現(xiàn)
    發(fā)表于 08-16 18:33

    HDC2024華為發(fā)布鴻蒙原生智能:AI與OS深度融合,開(kāi)啟全新的AI時(shí)代

    董事長(zhǎng)余承東先生表示:全新的Harmony Intelligence鴻蒙原生智能,將開(kāi)啟全新的AI時(shí)代! ? 軟硬芯云協(xié)同 鴻蒙原生智能深度
    的頭像 發(fā)表于 06-24 09:28 ?453次閱讀
    HDC2024華為發(fā)布鴻蒙<b class='flag-5'>原生</b>智能:<b class='flag-5'>AI</b>與OS深度融合,<b class='flag-5'>開(kāi)啟</b>全新的<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b>

    軟通動(dòng)力亮相2024中國(guó)移動(dòng)網(wǎng)絡(luò)大會(huì),共繪網(wǎng)絡(luò)新藍(lán)圖

    4月28日至29日,以“網(wǎng)絡(luò)點(diǎn)亮AI新時(shí)代”為主題的2024中國(guó)移動(dòng)網(wǎng)絡(luò)大會(huì)在蘇州隆重舉
    的頭像 發(fā)表于 05-06 10:20 ?358次閱讀
    軟通動(dòng)力亮相2024中國(guó)移動(dòng)<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)大會(huì),共繪<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)新藍(lán)圖

    AI時(shí)代怎么樣不被淘汰?訊飛AI鼠標(biāo)助力你在AI時(shí)代成長(zhǎng)

    AI時(shí)代怎么樣不被淘汰?訊飛AI鼠標(biāo)助力你在AI時(shí)代成長(zhǎng) 隨著人工智能的發(fā)展,
    的頭像 發(fā)表于 03-23 11:41 ?594次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b>怎么樣不被淘汰?訊飛<b class='flag-5'>AI</b>鼠標(biāo)<b class='flag-5'>助力</b>你在<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b>成長(zhǎng)

    一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放AI時(shí)代

    華為中國(guó)合作伙伴大會(huì) | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),以網(wǎng)強(qiáng),全面釋放AI時(shí)代
    的頭像 發(fā)表于 03-22 10:28 ?591次閱讀
    一圖看懂星河<b class='flag-5'>AI</b>數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b><b class='flag-5'>算</b><b class='flag-5'>力</b>

    云原生是大模型“降本增效”的解藥嗎?

    云原生AI正當(dāng)時(shí)
    的頭像 發(fā)表于 02-20 09:31 ?275次閱讀

    立足,聚焦AI!順網(wǎng)科技全面走進(jìn)AI時(shí)代

    “立足,聚焦AI”,順網(wǎng)科技進(jìn)軍AI時(shí)代的號(hào)角已被吹響。 1月18日,順網(wǎng)科技(3001
    的頭像 發(fā)表于 01-19 10:57 ?358次閱讀
    立足<b class='flag-5'>算</b><b class='flag-5'>力</b>,聚焦<b class='flag-5'>AI</b>!順網(wǎng)科技全面走進(jìn)<b class='flag-5'>AI</b>智<b class='flag-5'>算</b><b class='flag-5'>時(shí)代</b>

    弘信電子與AI服務(wù)器合資,助力國(guó)產(chǎn)芯片落地

    此外,弘信電子近期在AI業(yè)務(wù)上取得了突破性進(jìn)展,這并非源自本土化的積累,而是依賴于團(tuán)隊(duì)敏銳的戰(zhàn)略眼光和強(qiáng)烈的創(chuàng)新動(dòng)力。此次投資是弘信電子在AI
    的頭像 發(fā)表于 12-25 09:30 ?646次閱讀

    AGI時(shí)代的奠基石:Agent++大模型是構(gòu)建AI未來(lái)的三駕馬車嗎?

    AI Agent的訓(xùn)練離不開(kāi),服務(wù)器作為一個(gè)強(qiáng)大的計(jì)算中心,為AI Agent提供基礎(chǔ),
    的頭像 發(fā)表于 12-21 13:34 ?1055次閱讀
    AGI<b class='flag-5'>時(shí)代</b>的奠基石:Agent+<b class='flag-5'>算</b><b class='flag-5'>力</b>+大模型是構(gòu)建<b class='flag-5'>AI</b>未來(lái)的三駕馬車嗎?

    李彥宏,AI原生應(yīng)用的秋收時(shí)刻

    AI原生時(shí)代的“勸農(nóng)”人
    的頭像 發(fā)表于 10-17 11:44 ?480次閱讀
    李彥宏,<b class='flag-5'>AI</b><b class='flag-5'>原生</b>應(yīng)用的秋收時(shí)刻

    AI調(diào)度平臺(tái),大模型時(shí)代云計(jì)算的新生意

    這兩款AI產(chǎn)品與服務(wù)針對(duì)的是中心的短期建設(shè)與中長(zhǎng)期運(yùn)營(yíng)的需求。青云科技總裁林源表示,今天中國(guó)云計(jì)算市場(chǎng)處在
    的頭像 發(fā)表于 09-28 16:57 ?1840次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度平臺(tái),大模型<b class='flag-5'>時(shí)代</b>云計(jì)算的新生意