激情五月婷婷综合,国产成人毛片无码视频,亚洲日韩欧美三区在线视频

近期，勁爆亮相的ChatGPT著實讓人們眼前一亮，讓普羅大眾也“親密”體驗了人工智能（AI）的神奇魔力，窺見了智能未來的璀璨前景之一斑。

然而，就在這離生活愈來愈近的AI讓人們對未來充滿無限憧憬、滿懷激動的同時，也有冷靜的分析指出，諸如ChatGPT等AI規(guī)模應用也是一個“吞金獸”，其帶來的不僅僅是讓人急呼“AI算力告急”的算力消耗（有研究顯示，中國智能算力需求規(guī)模，到2026年就將進入每秒十萬億億次浮點計算（ZFLOPS）級別，達到1,271.4EFLOPS，從2021到2026年，年復合增長率將達52.3%1）；更有從云端、邊緣到終端廣泛AI應用場景，使得IT運營環(huán)境日益復雜和多樣，讓各種AI方案在異構平臺獲得便捷、易用且有效優(yōu)化成為急迫的需求。

異構計算，主要指不同類型的指令集和體系架構的計算單元組成的系統(tǒng)的計算方式，在云數(shù)據(jù)中心、邊緣計算場景等有著廣泛應用。

異構計算的興起與工作負載密切相關，在能有效發(fā)揮異構計算優(yōu)勢的應用場景中，人工智能場景可謂是典型的代表場景之一，不管是深度學習訓練，還是深度學習推理，都會進行大量矩陣運算，需要異構計算提供更有力支撐；而隨著AI應用快速走向邊緣，由此引致的云邊端協(xié)同，對異構計算提出了更高要求。計算平臺在提升自身算力水平的同時，也需要通過提供優(yōu)化策略，幫助用戶更好地提升AI方案的性能，助力AI應用降本增效。

騰訊云創(chuàng)新打造TACO Kit套件，為AI應用提供異構加速

為幫助廣大用戶應對日益復雜的異構環(huán)境給AI應用帶來的挑戰(zhàn)，騰訊云創(chuàng)新推出計算加速套件TACO Kit (TencentCloud Accelerated Computing Optimization Kit)，通過在異構硬件平臺上提供全棧式的軟硬件解決方案的模式，為AI方案設計者、AI開發(fā)人員以及AI使用者構建全新的異構計算加速軟件服務，助其借助多元化異構、高性能加速框架、離線虛擬化技術以及靈活的商業(yè)模式，輕松駕馭多元算力，助力AI應用全方位、全場景降本增效。

而作為異構加速服務的入口，TACO Kit內(nèi)置AI推理加速引擎TACO Infer，能針對AI應用中不同的訓練和服務框架、個性的優(yōu)化實踐和使用習慣、各異的軟件版本和硬件偏好，以計算加速、無感接入和魯棒易用的特性和優(yōu)勢，幫助用戶一站式解決AI模型在生產(chǎn)環(huán)境中部署與應用的痛點。

圖一 AI推理加速引擎TACO Infer

TACO Infer引擎具備的功能特性包括：

■無感集成：可跨平臺透明適配CPU、GPU、NPU等異構芯片；尊重用戶使用習慣，無需改變模型源格式；無需進行IR（Intermediate Representation，中間表示）轉換，對無顯式算子結構模型友好；

■基于原生框架Runtime：可基于多種流行原生框架，包括TensorFlow、PyTorch、ONNXRuntime 等運行；可基于框架原Runtime構建，并可充分利用框架自定義的擴展機制；

■無縫對接服務框架：包括TF Serving、Triton以及TorchServe等。

基于以上特性，無論在何種場景中，用戶在硬件平臺上部署AI應用，都只需要進行簡單地前端交互，就能讓TACO Kit在后臺以最佳模式啟動工作負載，并獲得更優(yōu)的推理性能。

而這一優(yōu)異推理性能的獲得，離不開英特爾和騰訊云面向TACO Kit開展的深度協(xié)作加持。具體講，就是將英特爾 Neural Compressor集成到TACO Kit之中，來大幅提升AI推理性能，加速各類AI應用便捷高效落地。

英特爾 Neural Compressor提供優(yōu)化支持，助力TACO Kit加速推理

英特爾 Neural Compressor是英特爾開源的神經(jīng)網(wǎng)絡模型壓縮庫，不僅面向如量化、修剪以及知識提取等主流模型壓縮技術，提供了跨多個深度學習框架的統(tǒng)一接口，還具有以下模型性能調(diào)優(yōu)特性：

■具備由精度驅(qū)動的自動化調(diào)整策略，幫助用戶快速獲得最佳量化模型；

■可使用預定義的稀疏性目標生成修剪模型，實現(xiàn)不同的權重修剪算法；

■能夠從更大的網(wǎng)絡（“教師”）中提取知識用于訓練更小的網(wǎng)絡（“學生”），實現(xiàn)更小的精度損失。

英特爾和騰訊云協(xié)作，通過插件的方式將英特爾 Neural Compressor集成到TACO Kit，讓TACO Kit充分利用英特爾 Neural Compressor的優(yōu)勢特性。如圖二所示，利用量化壓縮技術來為不同的深度深度框架（如TensorFlow、PyTorch、ONNXRuntime等）提供統(tǒng)一的模型優(yōu)化 API，便捷實現(xiàn)模型推理優(yōu)化（由FP32數(shù)據(jù)類型量化為INT8數(shù)據(jù)類型）。同時，也可以利用壓縮庫內(nèi)置的精度調(diào)優(yōu)策略，根據(jù)不同的模型內(nèi)部結構生成精度更佳的量化模型，幫助用戶大幅降低模型量化的技術門檻，并有效提升AI模型的推理效率。

圖二集成英特爾 Neural Compressor后的TACO Kit工作流程

在云端部署時，量化后的模型可通過英特爾至強可擴展平臺內(nèi)置的英特爾 DL Boost，來獲得有效的硬件加速和更高的推理效率。以指令集中的vpdpbusd指令為例，以往需要3條指令（vpmaddubsw、vpmaddwd、vpaddd）完成的64次乘加過程，現(xiàn)在僅需1條指令（vpdpbusd）即可，并能夠消除運行過程中的處理器飽和問題，再輔之以乘加過程中的中間數(shù)值直接從內(nèi)存播送，可使得處理性能達初始FP32模型的4倍2。這無疑為TACO Kit加速推理，進而幫助用戶在異構環(huán)境更高效地構建和部署AI提供了關鍵助力。

圖三英特爾 DL Boost（AVX-512_VNNI）技術

方案驗證顯真實性能，展異構AI加速優(yōu)勢

那么，集成英特爾 Neural Compressor后的TACO Kit的性能究竟有何等驚艷提升呢？實踐最有發(fā)言權，數(shù)據(jù)最有說服力。套件打造完成后，英特爾與騰訊云一起選取了多種被廣泛應用的自然語言處理深度學習模型，對TACO Kit性能加速進行了驗證測試。

測試中，各個深度學習模型在通過TACO Kit進行優(yōu)化后，使用英特爾 Neural Compressor進行INT8量化及性能調(diào)優(yōu)，推理性能加速結果令人滿意。如圖四所示3，在保持精度水平基本不變的情況下，各深度學習模型的推理性能均獲得顯著提升，提升幅度從55%到139%不等，在其中的bert-base-uncased-mrpc場景中，推理性能更是達到了基準值的2.39倍。

圖四集成英特爾 Neural Compressor的TACO Kit所帶來的推理性能加速4

對TACO Kit引入英特爾 Neural Compressor獲得的大幅性能加速，騰訊云異構計算專家級工程師葉帆直言，這一合作成果能幫助不同角色的用戶在異構硬件平臺上獲得便捷、易用且經(jīng)過有效優(yōu)化的 AI 加速能力，助力AI 應用實現(xiàn)全方位、全場景的降本增效。而英特爾 Neural Compressor 是 TACO Kit 中 AI 推理負載獲得充分性能加速的有效技術保證。

基于這一成果，英特爾和騰訊云也將面向未來繼續(xù)深化合作，通過融合硬件廠商優(yōu)化算子、自研AI編譯技術升級等措施，驅(qū)動TACO Infer在軟硬件兼容性和性能上不斷迭代優(yōu)化。同時，雙方還計劃進一步將第四代英特爾至強可擴展平臺及其內(nèi)置的深度學習加速技術與騰訊計算加速套件TACO Kit相融合，借助新平臺更為澎湃的算力輸出與深度學習加速新技術，為用戶提供更加高效可用的異構AI加速能力，進而在推動AI走向更廣泛應用的同時，助力應對多模態(tài)大模型等對算力提出的更嚴峻挑戰(zhàn)，驅(qū)動智能應用向縱深化演進，為經(jīng)濟社會的高質(zhì)量發(fā)展提供強勁數(shù)字生產(chǎn)力。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
60

文章
9858

瀏覽量
171241
AI

AI

+關注

關注
87

文章
29720

瀏覽量
268028
人工智能

人工智能

+關注

關注
1789

文章
46607

瀏覽量
236939

原文標題：提高AI算力，異構優(yōu)化也是關鍵

文章出處：【微信號：英特爾中國，微信公眾號：英特爾中國】歡迎添加關注！文章轉載請注明出處。

AI時代算力的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

在AI時代，算力扮演著至關重要的角色。如果說數(shù)據(jù)是AI大模型的“燃料”，那么算力則是其強大的“動

發(fā)表于 11-04 11:45 ?219次閱讀

算力再躍升！億萬克發(fā)布新一代AI服務器——G882N7+！

異構智算，指的是利用不同類型的處理器，比如CPU、GPU、FPGA等進行并行計算，來適應不同任務的計算需求，提高計算效率和性能。 ? 隨著人工智能技術熱潮的不斷發(fā)展，大模型迅猛發(fā)展呈現(xiàn)出新質(zhì)生產(chǎn)

發(fā)表于 10-25 17:02 ?155次閱讀

《算力芯片高性能 CPU/GPU/NPU 微架構分析》第1-4章閱讀心得——算力之巔：從基準測試到CPU微架構的深度探索

，還優(yōu)化了能效比，使天河二號在Green500榜單上也表現(xiàn)出色。另一方面，MLPerf的出現(xiàn)標志著AI時代對算力需求的變化。它涵蓋了圖像分類、目標檢測、自然語言理解、智能推薦算法、強化

發(fā)表于 10-19 01:21

聯(lián)想亮相2024中國算力大會

日前，2024中國算力大會在河南鄭州拉開帷幕。作為全球領先的算力基礎設施和服務提供商，聯(lián)想集團參會參展并攜手異構智

發(fā)表于 10-14 11:43 ?431次閱讀

青云科技強化AI算力架構,升級產(chǎn)品與服務體系

10月9日，青云科技正式揭曉了其升級版的產(chǎn)品與服務陣容、行業(yè)及場景定制化解決方案，以及全新的生態(tài)戰(zhàn)略。該公司旨在通過AI智算平臺、AI算力云

發(fā)表于 10-10 16:42 ?396次閱讀

中國智能汽車騰飛，為什么異構算力是第一生產(chǎn)力？

智能時代的“世紀之車”，異構算力是第一驅(qū)動力

發(fā)表于 09-14 10:32 ?3513次閱讀

中國智能汽車騰飛，為什么<b class='flag-5'>異構</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產(chǎn)<b class='flag-5'>力</b>？

大模型時代的算力需求

現(xiàn)在AI已進入大模型時代，各企業(yè)都爭相部署大模型，但如何保證大模型的算力，以及相關的穩(wěn)定性和性能，是一個極為重要的問題，帶著這個極為重要的問題，我需要在此書中找到答案。

發(fā)表于 08-20 09:04

安謀科技異構算力組合，破局生成式AI算力挑戰(zhàn)

近日，此芯科技集團有限公司（以下簡稱“此芯科技”）AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行，正式推出了其首款專為AI PC打造的異構高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI

發(fā)表于 08-13 09:12 ?494次閱讀

安謀科技異構算力賦能AI計算，此芯科技首款AI PC芯片發(fā)布

7月30日，此芯科技集團有限公司（以下簡稱“此芯科技”）AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行，正式推出了其首款專為AI PC打造的異構高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI

發(fā)表于 07-31 14:36 ?986次閱讀

神州鯤泰亮相北京數(shù)字安全大會，以智能算力構筑數(shù)據(jù)安全的堅實底座

GPU資源虛擬化或池化，完成跨集群之間的算力調(diào)度；打造異構智算加速平臺HICA，屏蔽集群內(nèi)底層算力

發(fā)表于 07-18 16:06 ?381次閱讀

異構混訓整合不同架構芯片資源，提高算力利用率

的解決方案。通過混合使用多種異構芯片，可以充分利用不同芯片的優(yōu)勢，提高算力利用率，降低算力成本，

發(fā)表于 07-18 00:11 ?3286次閱讀

DPU技術賦能下一代AI算力基礎設施

4月19日，在以“重構世界奔赴未來”為主題的2024中國生成式AI大會上，中科馭數(shù)作為DPU新型算力基礎設施代表，受邀出席了中國智算中心創(chuàng)新論壇，發(fā)表了題為《以網(wǎng)絡為中心的

發(fā)表于 04-20 11:31 ?783次閱讀

立足算力，聚焦AI！順網(wǎng)科技全面走進AI智算時代

“立足算力，聚焦AI”，順網(wǎng)科技進軍AI智算時代的號角已被吹響。 1月18日，順網(wǎng)科技（300113.SZ）以“躍遷·向未來”為主題的戰(zhàn)略升

發(fā)表于 01-19 10:57 ?431次閱讀

弘信電子與AI算力服務器合資，助力國產(chǎn)算力芯片落地

此外，弘信電子近期在AI算力業(yè)務上取得了突破性進展，這并非源自本土化的積累，而是依賴于團隊敏銳的戰(zhàn)略眼光和強烈的創(chuàng)新動力。此次投資是弘信電子在AI算

發(fā)表于 12-25 09:30 ?773次閱讀

燧原科技與青云科技達成戰(zhàn)略合作，創(chuàng)新異構算力調(diào)度

NEWS 燧原科技與青云科技日前達成戰(zhàn)略合作，攜手創(chuàng)新算力異構資源池的靈活調(diào)度，共建支持場景落地的AI算

發(fā)表于 12-11 12:20 ?578次閱讀

搜索歷史

提高AI算力，異構優(yōu)化也是關鍵

評論

AI時代算力的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

算力再躍升！億萬克發(fā)布新一代AI服務器——G882N7+！

《算力芯片高性能 CPU/GPU/NPU 微架構分析》第1-4章閱讀心得——算力之巔：從基準測試到CPU微架構的深度探索

聯(lián)想亮相2024中國算力大會

青云科技強化AI算力架構,升級產(chǎn)品與服務體系

中國智能汽車騰飛，為什么異構算力是第一生產(chǎn)力？

大模型時代的算力需求

安謀科技異構算力組合，破局生成式AI算力挑戰(zhàn)

安謀科技異構算力賦能AI計算，此芯科技首款AI PC芯片發(fā)布

神州鯤泰亮相北京數(shù)字安全大會，以智能算力構筑數(shù)據(jù)安全的堅實底座

異構混訓整合不同架構芯片資源，提高算力利用率

DPU技術賦能下一代AI算力基礎設施

立足算力，聚焦AI！順網(wǎng)科技全面走進AI智算時代

弘信電子與AI算力服務器合資，助力國產(chǎn)算力芯片落地

燧原科技與青云科技達成戰(zhàn)略合作，創(chuàng)新異構算力調(diào)度