国产一区二区三区免费视频在线播放,av无码专区亚洲,果冻传媒我的女老板

介紹

用于Apache Spark 的 RAPIDS 加速器 8 月版（ 21.08 ）現(xiàn)已發(fā)布。自 NVIDIA GTC 2020 首次發(fā)布以來，已經(jīng)有很長時間了。我們在許多方面都有所改進，特別是在易用性方面， Apache Spark 應(yīng)用程序的代碼更改很少甚至沒有。去年，該團隊一直專注于添加功能和持續(xù)改進性能。為了證明這一點，我們使用 NVIDIA 數(shù)據(jù)科學(xué)（ NDS ）基準(zhǔn)測試了定期測量在 3000 （ 3 TB 未壓縮）的比例因子下的性能和功能。在此版本中，除了添加新功能外，我們非常自豪地在提高所有通過查詢的端到端速度和降低 NVIDIA EGX 服務(wù)器的總體擁有成本方面取得了進展。

基準(zhǔn)更新

NVIDIA 決策支持（ NDS ）是我們對 Apache Spark 社區(qū)常用的行業(yè)標(biāo)準(zhǔn)數(shù)據(jù)科學(xué)基準(zhǔn)的改編。 NDS 包含與行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測試 TPC-DS 相同的 105 個 SQL 查詢，但修改了數(shù)據(jù)集生成和執(zhí)行腳本的部分。在 GTC 2021 更新中，有 95 個查詢通過。在 21.08 版本中，通過核心外分組方式、窗口排名和密集排名等新功能，我們已經(jīng)能夠在 GPU 上運行所有 105 個查詢。

基準(zhǔn)設(shè)置

比例因子 -3K （帶浮點數(shù)的 3TB 數(shù)據(jù)集）

Systems： 4x NVIDIA 認證 EGX 服務(wù)器

EGX 服務(wù)器硬件規(guī)格： 4-node Dell R740xd， each with （2） 24-core CPUs， 512GB RAM， HDFS on NVMe，（1） CX-6 Dx 25/100Gb NIC， 2x NVIDIA A30 GPU

CPU 硬件規(guī)格： 4-node dell r740xd ， each with （ 2 ） 24-core CPU s ， 512GB ram ， hdfs on nvme ，（ 1 ） cx-6 dx 25 / 100gb nic

軟件： RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

圖 1 ： EGX 服務(wù)器上的 NDS 查詢速度： GPU vs CPU 。

基于此版本，我們很高興地向大家展示，所有 105 個查詢現(xiàn)在都可以在 GPU 上運行，而無需任何代碼更改。

用于這些基準(zhǔn)測試的基準(zhǔn)服務(wù)器對于四臺沒有 GPU s 的服務(wù)器的成本略低于 170000 美元，而在每臺服務(wù)器中包含一臺 NVIDIA A100 GPU 的成本則低于 220000 美元。

簡單來說，基準(zhǔn) GPU 服務(wù)器的成本是 CPU 服務(wù)器的 1.29 倍。

如上圖所示（圖 1 ），超過 95 個查詢現(xiàn)在比 GPU 快 1.29 倍，因此運行起來更便宜。

GPU 上一些速度較慢的查詢目前正在解決中，我們正在不懈地努力改進這些查詢并提高總體速度。

用戶可以很容易地推斷出 GPU 的加速從 1x 到 18x 不等，因此建議用戶確認 GPU 的正確用例。

如果用戶不確定 GPU 的正確用例，鑒定工具將是一個方便的資產(chǎn)。有關(guān)鑒定工具的更多信息，請參閱以下章節(jié)。

分析和鑒定工具

分析與鑒定工具于 21.06 發(fā)布，獲得了用戶社區(qū)的積極反饋以及對新功能的要求。在 21.08 中，鑒定工具現(xiàn)在能夠處理 Apache Spark 2.x 版本生成的事件日志。該工具還將支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 運行時生成的事件日志。鑒定工具不再需要 Spark 運行時。用戶現(xiàn)在只需在機器上使用 Apache Spark 3.x JAR 即可使用鑒定工具。最新版本還具有選擇事件日志的新過濾功能。該工具還查找插件不支持的讀取數(shù)據(jù)格式和類型，并從分數(shù)中刪除這些格式和類型（基于 SQL Dataframe 操作中的總?cè)蝿?wù)時間）。輸出將以簡潔的格式報告在終端上，對每個已處理事件日志的詳細分析將存儲為 csv 輸出。

新功能

此版本為數(shù)組和結(jié)構(gòu)添加了更多功能。我們現(xiàn)在可以對多層結(jié)構(gòu)數(shù)據(jù)類型進行聯(lián)合，也可以以拼花格式編寫數(shù)組數(shù)據(jù)類型。我們在現(xiàn)有的超前、滯后和行號功能中添加了秩和密集秩窗口功能。有了這一新增功能， RAPIDS 加速器現(xiàn)在可以支持 SQL 中最常用的窗口運算符。對于時間戳操作符，我們添加了對遺留時間戳的支持。使用此功能，用戶可以讀取 Spark 2.0 中支持的傳統(tǒng)時間戳格式。對于 Databricks 用戶，我們添加了在 GPU 中緩存數(shù)據(jù)的功能（所有其他平臺都支持這種功能）。

我們通過處理 GPU 內(nèi)存溢出的數(shù)據(jù)集以進行分組和窗口操作，繼續(xù)改善用戶體驗。這一改進將節(jié)省用戶創(chuàng)建分區(qū)的時間，以避免 GPU 上出現(xiàn)內(nèi)存不足錯誤。類似地， UCX 1.11 的采用改進了 RAPIDS Spark 加速洗牌管理器的錯誤處理。

關(guān)于作者

Eric Rife 是 NVDIA 數(shù)據(jù)科學(xué)公司的技術(shù)營銷經(jīng)理。他是一名高級專業(yè)人員，擁有 25 年的管理和工程經(jīng)驗，設(shè)計和管理全天候關(guān)鍵任務(wù)企業(yè)系統(tǒng)，包括 Unix / Linux / Windows 服務(wù)器、應(yīng)用程序服務(wù)器和多 PB 存儲解決方案。他目前領(lǐng)導(dǎo) NVIDIA 的工作，幫助基礎(chǔ)設(shè)施經(jīng)理和數(shù)據(jù)科學(xué)家重新思考如何加快 AI 在企業(yè)業(yè)務(wù)應(yīng)用中的應(yīng)用。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
12

文章
8700

瀏覽量
84537
WINDOWS

WINDOWS

+關(guān)注

關(guān)注
3

文章
3503

瀏覽量
87881

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè)，也是 NVIDIA 初創(chuàng)加速計劃成員，其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫，是支持復(fù)雜計算和流數(shù)據(jù)分析的實時計算平臺，適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。

發(fā)表于 09-09 09:57 ?264次閱讀

利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺提升計算性能

“白地板”方案，智算中心加速器

明德源能白地板方案，智算中心加速器

發(fā)表于 06-21 11:54 ?651次閱讀

NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”

根據(jù)各方信息和路線圖，NVIDIA預(yù)計會在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”。

發(fā)表于 03-04 09:33 ?1093次閱讀

<b class='flag-5'>NVIDIA</b>將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU<b class='flag-5'>加速器</b>“B100”

家居智能化，推動AI加速器的發(fā)展

電子發(fā)燒友網(wǎng)報道（文/黃山明）AI加速芯片，也稱為人工智能加速器（AI Accelerator），是一種專為執(zhí)行機器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計的ASIC或定制化處理器。在智能家居中，AI加速

發(fā)表于 02-23 00:18 ?4404次閱讀

回旋加速器原理回旋加速器的影響因素

回旋加速器（Cyclotron）是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器的原理以及影響因素。一、回旋

發(fā)表于 01-30 10:02 ?3041次閱讀

回旋加速器中粒子的最大動能與什么有關(guān)

回旋加速器是一種用于加速粒子的裝置，通過不斷變化的磁場和電場來不斷加速粒子，使其達到極高的速度和能量。粒子的最大動能取決于幾個關(guān)鍵因素。首先，回旋加速器的設(shè)計和性能對粒子的最大動能有

發(fā)表于 01-18 10:42 ?2676次閱讀

Wakefield激光加速器 - 能量里程碑

由The University of Texas at Austin物理學(xué)副教授比約恩·“曼努埃爾”·赫格利希（Bjorn “Manuel” Hegelich）領(lǐng)導(dǎo)的國際研究小組最近展示了一種長度不到20米的小型粒子加速器，該加速器產(chǎn)生的電子束能量為100億電子伏特（10

發(fā)表于 01-14 09:38 ?874次閱讀

粒子加速器的加速原理是啥呢？

粒子加速器的加速原理是啥呢？粒子加速器是一種重要的實驗設(shè)備，用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過電場和磁場的作用，對帶電粒子進行加速，在高速運動過程中使其獲得較大的動

發(fā)表于 12-18 13:52 ?1667次閱讀

在CCES環(huán)境下如何使用21489的IIR加速器？

在VDSP++的環(huán)境下程序已經(jīng)實現(xiàn)，但是到了CCES下，把中斷初始化函數(shù)修改了，還是無法正確配置中斷，直接返回IIR的中斷初始化失敗，請問CCES下怎么使用IIR加速器？

發(fā)表于 11-30 08:20

21489的IIR加速器濾波參數(shù)設(shè)置如何對應(yīng)加速器的濾波參數(shù)？

目前在用21489內(nèi)部的IIR加速器去做一個低通濾波器，在例程的基礎(chǔ)上修改參數(shù)。通過平板的fda 工具工具去設(shè)計參數(shù)，但是設(shè)計出來的參數(shù)不知道如何對應(yīng)加速器的濾波參數(shù)，手冊里也看得不是很明白。設(shè)計的參數(shù)如下：請問

發(fā)表于 11-30 08:11

使用ADSP-21489的fir加速器時，存在很大的噪音如何解決？

您好！當(dāng)我使用ADSP-21489的fir加速器時，存在很大的噪音，未知如何解決，希望這里有高人幫我解決。附件上有工程，該工程參考iir加速器使用例子編寫。

發(fā)表于 11-30 07:49

PCIe在AI加速器中的作用

從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收，再到在線視頻游戲，所有的這些都離不開人工智能（AI）加速器。AI加速器是一種高性能的并行計算設(shè)備，旨在高效處理神經(jīng)網(wǎng)絡(luò)等AI工作負載并提供近乎實時的處理方案，從而實現(xiàn)一系列應(yīng)用。

發(fā)表于 11-18 10:36 ?1774次閱讀

芯片大小的電子加速器或?qū)⒖紤]到皮膚癌癥治療應(yīng)用

粒子加速器的大小不一，有的可以裝在實驗室里，有的則需要占據(jù)幾公里甚至幾十公里的空間。然而，一項新的研究發(fā)現(xiàn)，現(xiàn)在科學(xué)家們正在更仔細地研究芯片大小的電子加速器。該技術(shù)的近期潛在應(yīng)用包括用于精準(zhǔn)治療

發(fā)表于 10-31 09:44 ?489次閱讀

一個微型的粒子加速器

粒子加速器是一種利用電場和磁場來加速帶電粒子，如電子、質(zhì)子或離子，使其達到非常高的能量的裝置。它們在科學(xué)、醫(yī)學(xué)和工業(yè)等領(lǐng)域有許多應(yīng)用，如研究物質(zhì)的結(jié)構(gòu)、制造醫(yī)用同位素或產(chǎn)生X射線。然而，大多數(shù)粒子加速器都非常龐大和昂貴，需要數(shù)公

發(fā)表于 10-31 09:31 ?654次閱讀

AI芯片設(shè)計DNN加速器buffer管理策略

如前所述，數(shù)據(jù)緩存是創(chuàng)建高效DNN加速器的關(guān)鍵組件之一。因此，除了選擇適當(dāng)?shù)臄?shù)據(jù)流(控制數(shù)據(jù)緩存的位置和時間)外，DNN加速器還需要一個緩存方案

發(fā)表于 10-17 17:23 ?1190次閱讀