釜山行中文版完整播放国语,亚洲欧美在线观看视频,久久久久这里只有精品网

最高額。翻牌。GFLOPS。AI 處理器供應(yīng)商以多種方式計(jì)算其架構(gòu)的最大推理性能。

這些數(shù)字還重要嗎？它們中的大多數(shù)是在實(shí)驗(yàn)室類型的環(huán)境中生產(chǎn)的，理想的條件和工作負(fù)載允許被測(cè)設(shè)備（SUT）為營銷目的生成盡可能高的分?jǐn)?shù)。另一方面，大多數(shù)工程師可能不太關(guān)心這些理論上的可能性。他們更關(guān)心技術(shù)如何影響推理設(shè)備的準(zhǔn)確性、吞吐量和/或延遲。

將計(jì)算元素與特定工作負(fù)載進(jìn)行比較的行業(yè)標(biāo)準(zhǔn)基準(zhǔn)更加有用。例如，圖像分類工程師可以識(shí)別出多個(gè)滿足其性能要求的選項(xiàng)，然后根據(jù)功耗、成本等因素對(duì)其進(jìn)行縮減。語音識(shí)別設(shè)計(jì)人員可以使用基準(zhǔn)測(cè)試結(jié)果來分析各種處理器和內(nèi)存組合，然后決定是否合成本地或云中的語音。

但 AI 和 ML 模型、開發(fā)框架和工具的快速引入使此類比較變得復(fù)雜。如圖 1 所示，AI 技術(shù)堆棧中越來越多的選項(xiàng)也意味著可用于判斷推理性能的排列呈指數(shù)級(jí)增長。那是在考慮可以針對(duì)給定系統(tǒng)架構(gòu)優(yōu)化模型和算法的所有方式之前。

圖 1. AI 開發(fā)堆棧中越來越多的選項(xiàng)具有復(fù)雜的行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試。

不用說，開發(fā)這樣一個(gè)全面的基準(zhǔn)超出了大多數(shù)公司的能力或愿望。即使有能力完成這一壯舉，工程界真的會(huì)接受它作為“標(biāo)準(zhǔn)基準(zhǔn)”嗎？

MLPerf：更好的 AI 推理基準(zhǔn)

更廣泛地說，工業(yè)界和學(xué)術(shù)界在過去幾年中開發(fā)了幾個(gè)推理基準(zhǔn)，但他們傾向于關(guān)注新生人工智能市場(chǎng)的更多利基領(lǐng)域。一些例子包括 EEMBC 用于嵌入式圖像分類和對(duì)象檢測(cè)的 MLMark，蘇黎世聯(lián)邦理工學(xué)院針對(duì) Android 智能手機(jī)上的計(jì)算機(jī)視覺的 AI 基準(zhǔn)，以及哈佛的 Fathom 基準(zhǔn)，它強(qiáng)調(diào)各種神經(jīng)網(wǎng)絡(luò)的吞吐量，但不強(qiáng)調(diào)準(zhǔn)確性。

可以在 MLPerf 最近發(fā)布的 Inference v0.5 基準(zhǔn)測(cè)試中找到對(duì) AI 推理環(huán)境的更完整評(píng)估。MLPerf Inference 是一個(gè)社區(qū)開發(fā)的測(cè)試套件，可用于測(cè)量 AI 硬件、軟件、系統(tǒng)和服務(wù)的推理性能。這是來自 30 多家公司的 200 多名工程師合作的結(jié)果。

正如您對(duì)任何基準(zhǔn)測(cè)試所期望的那樣，MLPerf Inference 定義了一套標(biāo)準(zhǔn)化的工作負(fù)載，這些工作負(fù)載被組織成用于圖像分類、對(duì)象檢測(cè)和機(jī)器翻譯用例的“任務(wù)”。每個(gè)任務(wù)都由與正在執(zhí)行的功能相關(guān)的 AI 模型和數(shù)據(jù)集組成，圖像分類任務(wù)支持 ResNet-50 和 MobileNet-v1 模型，對(duì)象檢測(cè)任務(wù)利用具有 ResNet34 或 MobileNet-v1 主干的 SSD 模型，以及使用 GNMT 模型的機(jī)器翻譯任務(wù)。

除了這些任務(wù)之外，MLPerf 推理開始偏離傳統(tǒng)基準(zhǔn)的規(guī)范。由于不同用例對(duì)準(zhǔn)確性、延遲、吞吐量和成本的重要性的權(quán)重不同，MLPerf Inference 通過根據(jù)移動(dòng)設(shè)備、自動(dòng)駕駛汽車、機(jī)器人和云這四個(gè)關(guān)鍵應(yīng)用領(lǐng)域的質(zhì)量目標(biāo)對(duì)推理性能進(jìn)行分級(jí)來進(jìn)行權(quán)衡。

為了在盡可能接近在這些應(yīng)用程序領(lǐng)域運(yùn)行的真實(shí)系統(tǒng)的上下文中有效地對(duì)任務(wù)進(jìn)行評(píng)分，MLPerf Inference 引入了負(fù)載生成器工具，該工具根據(jù)四種不同的場(chǎng)景生成查詢流量：

樣本大小為 1 的連續(xù)單流查詢，在移動(dòng)設(shè)備中很常見

每個(gè)流具有多個(gè)樣本的連續(xù)多流查詢，如在延遲至關(guān)重要的自動(dòng)駕駛汽車中發(fā)現(xiàn)的那樣

請(qǐng)求隨機(jī)到達(dá)的服務(wù)器查詢，例如在延遲也很重要的 Web 服務(wù)中

執(zhí)行批處理且吞吐量是一個(gè)突出考慮因素的離線查詢

Load Generator 以測(cè)試準(zhǔn)確性和吞吐量（性能）的模式提供這些場(chǎng)景。圖 2 描述了 SUT 如何接收來自負(fù)載生成器的請(qǐng)求，從而將數(shù)據(jù)集中的樣本加載到內(nèi)存中，運(yùn)行基準(zhǔn)測(cè)試并將結(jié)果返回給負(fù)載生成器。然后，準(zhǔn)確性腳本會(huì)驗(yàn)證結(jié)果。

圖 2. MLPerf Inference 基準(zhǔn)測(cè)試依賴于負(fù)載生成器，該負(fù)載生成器根據(jù)許多實(shí)際場(chǎng)景查詢被測(cè)系統(tǒng) （SUT）。

作為基準(zhǔn)測(cè)試的一部分，每個(gè) SUT 必須執(zhí)行最少數(shù)量的查詢以確保統(tǒng)計(jì)可信度。

提高靈活性

如前所述，人工智能技術(shù)市場(chǎng)中使用的各種框架和工具是任何推理基準(zhǔn)測(cè)試的關(guān)鍵挑戰(zhàn)。前面提到的另一個(gè)考慮因素是模型和算法的調(diào)整，以從 AI 推理系統(tǒng)中擠出最高的準(zhǔn)確性、吞吐量或最低的延遲。就后者而言，量化和圖像重塑等技術(shù)現(xiàn)在已成為常見做法。

MLPerf Inference 是語義級(jí)別的基準(zhǔn)測(cè)試，這意味著，雖然基準(zhǔn)測(cè)試提供了特定的工作負(fù)載（或一組工作負(fù)載）和執(zhí)行它的一般規(guī)則，但實(shí)際實(shí)施取決于執(zhí)行基準(zhǔn)測(cè)試的公司。公司可以優(yōu)化提供的參考模型，使用他們想要的工具鏈，并在他們選擇的硬件目標(biāo)上運(yùn)行基準(zhǔn)測(cè)試，只要它們保持在一定的指導(dǎo)范圍內(nèi)。

然而，重要的是要注意，這并不意味著提交公司可以隨意使用 MLPerf 模型或數(shù)據(jù)集，并且仍然有資格獲得主要基準(zhǔn)。MLPerf 推理基準(zhǔn)分為兩個(gè)部分 - 封閉式和開放式 - 封閉式部分對(duì)可以使用哪些類型的優(yōu)化技術(shù)以及禁止使用其他優(yōu)化技術(shù)有更嚴(yán)格的要求。

要獲得封閉部門的資格，提交者必須使用提供的模型和數(shù)據(jù)集，但允許量化。為確保兼容性，封閉部門的參賽者不能使用經(jīng)過重新訓(xùn)練或修剪的模型，也不能使用經(jīng)過調(diào)整以具有基準(zhǔn)或數(shù)據(jù)集感知能力的緩存或網(wǎng)絡(luò)。

另一方面，開放部門旨在促進(jìn)人工智能模型和算法的創(chuàng)新。提交給開放部門仍然需要執(zhí)行相同的任務(wù)，但可以更改模型類型、重新訓(xùn)練和修剪其模型、使用緩存等。

盡管封閉部門聽起來很嚴(yán)格，但有 150 多個(gè)條目成功地獲得了 MLPerf Inference v0.5 發(fā)布的資格。圖 3 和圖 4 展示了參賽者使用的 AI 技術(shù)堆棧的多樣性，涵蓋了幾乎所有類型的處理器架構(gòu)和軟件框架，從 ONNX 和 PyTorch 到 TensorFlow、OpenVINO 和 Arm NN。

圖 3. DSP、FPGA、CPU、ASIC 和 GPU 均成功完成了 MLPerf Inference 封閉劃分要求。

圖 4. AI 軟件開發(fā)框架（如 ONNX、PyTorch、TensorFlow、OpenVINO、Arm NN 等）用于開發(fā)符合封閉劃分基準(zhǔn)的 MLPerf 推理系統(tǒng)。

將猜測(cè)排除在評(píng)估之外

雖然 MLPerf Inference 的初始版本包含一組有限的模型和用例，但基準(zhǔn)測(cè)試套件是以模塊化、可擴(kuò)展的方式構(gòu)建的。隨著技術(shù)和行業(yè)的發(fā)展，這將使 MLPerf 能夠擴(kuò)展任務(wù)、模型和應(yīng)用領(lǐng)域，并且該組織已經(jīng)計(jì)劃這樣做。

最新的 AI 推理基準(zhǔn)顯然具有重要意義，因?yàn)樗悄壳翱捎玫淖罱咏鎸?shí)世界 AI 推理性能的衡量標(biāo)準(zhǔn)。但隨著它的成熟和吸引更多的提交，它也將成為成功部署技術(shù)堆棧的晴雨表和新實(shí)施的試驗(yàn)場(chǎng)。

為什么不讓技術(shù)自己說話，而不是處理特定于供應(yīng)商的數(shù)據(jù)表數(shù)字呢？畢竟，更少的猜測(cè)意味著更強(qiáng)大的解決方案和更快的上市時(shí)間。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
18924

瀏覽量
227204
嵌入式

嵌入式

+關(guān)注

關(guān)注
5045

文章
18816

瀏覽量
298457
AI

AI

+關(guān)注

關(guān)注
87

文章
28875

瀏覽量
266201

評(píng)論

相關(guān)推薦

什么是邊緣AI？邊緣AI的供電挑戰(zhàn)

RECOM 的 RACM1200-V 采用數(shù)字通信，可輕松集成到邊緣 AI設(shè)計(jì)中。

發(fā)表于 09-02 11:52 ?230次閱讀

什么是<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>？<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的供電挑戰(zhàn)

智能邊緣放大招！英特爾舉辦2024網(wǎng)絡(luò)與邊緣計(jì)算行業(yè)大會(huì)，邊緣AI創(chuàng)新助力多元化應(yīng)用

今日，第十七屆英特爾網(wǎng)絡(luò)與邊緣計(jì)算行業(yè)大會(huì)在天津舉行，超過400位生態(tài)伙伴和客戶代表齊聚一堂，與英特爾共同探討邊緣AI的未來發(fā)展趨勢(shì)，并介紹了眾多基于英特爾

發(fā)表于 07-25 09:10 ?2837次閱讀

智能<b class='flag-5'>邊緣</b>放大招！英特爾舉辦2024網(wǎng)絡(luò)與<b class='flag-5'>邊緣</b>計(jì)算<b class='flag-5'>行業(yè)</b>大會(huì)，<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>創(chuàng)新助力多元化應(yīng)用

如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

香橙派AIpro開發(fā)板采用昇騰AI技術(shù)路線，接口豐富且具有強(qiáng)大的可擴(kuò)展性，提供8/20TOPS澎湃算力，可廣泛使用于AI邊緣計(jì)算、深度視覺學(xué)習(xí)及視頻流AI分析、視頻圖像分析、自然語言處

發(fā)表于 06-04 14:23 ?328次閱讀

如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

ai邊緣盒子有哪些用途？ai視頻分析邊緣計(jì)算盒子詳解

近年來，隨著人工智能和邊緣計(jì)算的發(fā)展，一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣計(jì)算和AI算法處理能力的設(shè)備，

發(fā)表于 05-29 14:24 ?621次閱讀

<b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途？<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計(jì)算盒子詳解

邊緣側(cè)AI芯片提供商超星未來完成數(shù)億元 Pre-B輪融資

在AI產(chǎn)業(yè)生態(tài)中，計(jì)算芯片被視為行業(yè)的“賣水人”。依據(jù)云端/邊緣端、訓(xùn)練/推理兩大分類標(biāo)準(zhǔn)，AI芯片可劃分為四個(gè)類別，其中

發(fā)表于 05-09 09:38 ?436次閱讀

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

識(shí)別demo: JS實(shí)現(xiàn)UI界面的功能； Native接口及實(shí)現(xiàn)主要為JS提供接口進(jìn)行AI推理。通過Native方式完成推理的前處理、推理以及后處理，這里通過調(diào)用opencv、Mind

發(fā)表于 04-11 16:14

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試，基于Stable Diffusion

UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測(cè)試，以計(jì)算機(jī)視覺工作負(fù)載評(píng)估AI推理性能。新推出的圖像生成測(cè)試將提供統(tǒng)一、精

發(fā)表于 03-25 16:16 ?705次閱讀

基于EdgeX+OpenVINO?的邊緣智能融合網(wǎng)關(guān)YiFUSION實(shí)戰(zhàn)

有邊緣智能需求的大部分客戶已經(jīng)對(duì)AI推理和邊緣計(jì)算有一定的了解，都希望可以將邊緣數(shù)采和AI

發(fā)表于 02-29 18:18 ?1030次閱讀

基于EdgeX+OpenVINO?的<b class='flag-5'>邊緣</b>智能融合網(wǎng)關(guān)YiFUSION實(shí)戰(zhàn)

什么是AI邊緣計(jì)算，AI邊緣計(jì)算的特點(diǎn)和優(yōu)勢(shì)介紹

隨著人工智能的迅猛發(fā)展，AI邊緣計(jì)算成為了熱門話題。那么什么是AI邊緣計(jì)算呢？簡(jiǎn)單來說，它是將人工智能技術(shù)引入邊緣計(jì)算的新興領(lǐng)域，旨在將計(jì)算

發(fā)表于 02-01 11:42 ?699次閱讀

邊緣AI它到底是什么？能做什么？

邊緣，減少了數(shù)據(jù)的傳輸延遲和依賴云端的通信需求。邊緣AI能夠在接近數(shù)據(jù)源的設(shè)備上進(jìn)行實(shí)時(shí)決策和推理，這為許多應(yīng)用領(lǐng)域帶來了革命性的改變。邊緣

發(fā)表于 01-11 14:44 ?1093次閱讀

英特爾發(fā)布第五代至強(qiáng)可擴(kuò)展處理器：性能和能效大幅提升，AI 加速

此外，至強(qiáng)可擴(kuò)展處理器被譽(yù)為行業(yè)首屈一指的內(nèi)置AI加速器數(shù)據(jù)中心處理器，全新第五代產(chǎn)品更能優(yōu)化參數(shù)量高達(dá)200億的大型語言模型，使其推理性能提升42％。眼下，它還是唯一歷次刷新MLPerf

發(fā)表于 12-15 11:02 ?695次閱讀

HarmonyOS：使用MindSpore Lite引擎進(jìn)行模型推理

場(chǎng)景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設(shè)備 AI 模型推理的功能，目前已經(jīng)在圖像分類、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。本文介紹

發(fā)表于 12-14 11:41

凌華科技發(fā)布全新工業(yè)級(jí)邊緣AI平臺(tái)

DLAP-211-Orin系列和DLAP-411-Orin工業(yè)級(jí)邊緣AI平臺(tái)，重新定義了智慧城市、零售、安全、工廠和制造等各個(gè)領(lǐng)域的AI應(yīng)用基準(zhǔn)，為

發(fā)表于 12-13 11:27 ?651次閱讀

攜手 MLCommons，制定有效且值得信賴的 AI 安全基準(zhǔn)

Association 運(yùn)用 MLPerf 基準(zhǔn)，來衡量如 Google 的 TPU 等尖端 AI 硬件的速度。然而，盡管圍繞 AI 安全已經(jīng)做了大量工作，目前仍然沒有類似的 A

發(fā)表于 12-05 18:10 ?416次閱讀

算力強(qiáng)勁的AI邊緣計(jì)算盒子# 邊緣計(jì)算

AI邊緣計(jì)算

成都華江信息
發(fā)布于 :2023年11月24日 16:31:06

搜索歷史

MLPerf是邊緣AI推理的新行業(yè)基準(zhǔn)

評(píng)論

什么是邊緣AI？邊緣AI的供電挑戰(zhàn)

智能邊緣放大招！英特爾舉辦2024網(wǎng)絡(luò)與邊緣計(jì)算行業(yè)大會(huì)，邊緣AI創(chuàng)新助力多元化應(yīng)用

如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

ai邊緣盒子有哪些用途？ai視頻分析邊緣計(jì)算盒子詳解

邊緣側(cè)AI芯片提供商超星未來完成數(shù)億元 Pre-B輪融資

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試，基于Stable Diffusion

基于EdgeX+OpenVINO?的邊緣智能融合網(wǎng)關(guān)YiFUSION實(shí)戰(zhàn)

什么是AI邊緣計(jì)算，AI邊緣計(jì)算的特點(diǎn)和優(yōu)勢(shì)介紹

邊緣AI它到底是什么？能做什么？

英特爾發(fā)布第五代至強(qiáng)可擴(kuò)展處理器：性能和能效大幅提升，AI 加速

HarmonyOS：使用MindSpore Lite引擎進(jìn)行模型推理

凌華科技發(fā)布全新工業(yè)級(jí)邊緣AI平臺(tái)

攜手 MLCommons，制定有效且值得信賴的 AI 安全基準(zhǔn)

算力強(qiáng)勁的AI邊緣計(jì)算盒子# 邊緣計(jì)算