0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA GPU并行計算技術解決AI研究問題

星星科技指導員 ? 來源:NVIDIA ? 作者:Solee Moon ? 2022-04-19 16:44 ? 次閱讀

由于冠狀病毒的存在, 2021 年韓國科學技術信息研究所( KISTI ) GPU 黑客大賽在 KISTI NVIDIA 和 OpenACC 組織的專家導師指導下舉行。為了激發(fā)科學家加速 AI 研究或 HPC 代碼的可能性, hackathon 提供了利用 NVIDIA GPU并行計算技術解決研究問題和擴展專業(yè)知識的機會。

以面對面活動而聞名的虛擬黑客大會對與會者和主持人都提出了自己的挑戰(zhàn)。新的模式還需要兼顧由三個 HPC 和 AI 團隊、四個高等教育和研究團隊以及兩個行業(yè)團隊組成的多樣化團隊。

活動團隊發(fā)現(xiàn)以下配方有助于為參與者創(chuàng)造有意義的成功體驗:

指導

基于他們在特定領域或編程語言方面的專業(yè)知識,專門的導師與團隊一起進行指導,以設定目標,并考慮不同的方法。導師們合作解決團隊遇到的問題并排除障礙。每天的導師同步電話讓每個人都集中精力,朝著實現(xiàn)目標的最佳策略努力。

社交

每個人都知道,只工作不玩耍實際上會阻礙團隊的生產(chǎn)力。 hackathon 為參與者和導師提供了 TGIF 社交時間會議。使用 Metaverse Gather 城鎮(zhèn)空間,導師和團隊分享經(jīng)驗,為電池充電,并建立聯(lián)系,幫助他們在活動期間繼續(xù)前進。

資源和現(xiàn)場研討會

成功的另一個重要因素是為與會者提供專門的培訓和資源。例如, NVIDIA 深度學習培訓中心( DLI )的一位大使和導師介紹了一個涵蓋 CUDA C / C ++主題的研討會。其他導師提供了團隊專用的技術課程,重點是TRT和 NVIDIA Triton 、OpenACC和 NSight 系統(tǒng)的評測、并行計算和優(yōu)化。

努力工作是有回報的

延世大學的帕斯卡團隊正在開發(fā)一種熱流體解算器,該解算器可以有效地計算湍流的熱運動。在這次黑客大會上,團隊通過 OpenACC 和 cuFFT 庫將基于 CPU 的現(xiàn)有代碼轉換為多 GPU 環(huán)境。這使得最耗時的子程序之一的計算速度加快了 4 . 84 倍 RHS (右側,分步)。

來自 AmorePacific 化妝品公司的 Amore Opt 團隊致力于 GPU 優(yōu)化 DeepLabV3 +細分模型。通過應用他們對 TensorRT 推理優(yōu)化器和 NVIDIA Triton 推理服務器的了解,他們提高了推理速度,使推理速度提高了 26 倍。他們做到了這一點,同時保持人工智能模型的準確性,以便為未來的大規(guī)??蛻舴?a target="_blank">檢測皮膚問題。

首爾國立大學的 TFC 團隊參與了一個項目,以加速基于 CPU 的 Fortran 內(nèi)部流體計算代碼。通過在 KISTI 使用 NVIDIA GPU s ,團隊加速了耗時的三對角矩陣算法( TDMA )用于熱解算器和動量解算器,以及快速傅立葉變換( FFT )用于壓力解算器計算。他們在一臺 V100 GPU 上實現(xiàn)了 11.15 倍的速度。

NVIDIA Inception 成員 Nota 和杭陽大學合作,通過利用 NVIDIA GPU s 中的張量核進行 INT4 量化,優(yōu)化了 Nota 模型壓縮引擎。名為 NOTA-HYU 的團隊學會了使用 NVIDIA 分析工具 NSight 系統(tǒng)和 NSight 計算。然后,他們應用 NVIDIA 庫彎刀,通過 CUDA 優(yōu)化,使剩余塊的總體速度提高 1.85 倍。

關于作者

Solee Moon 是 NVIDIA 高等教育與研究( HER )和 NVIDIA 深度學習培訓中心( DLI )項目的企業(yè)營銷專家,專注于支持 AI 開發(fā)者社區(qū)的發(fā)展。在 NVIDIA 之前, Solee 曾在三星電子 CTR 擔任品牌營銷專家,執(zhí)行各種整合營銷傳播活動。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4795

    瀏覽量

    102463
  • 深度學習
    +關注

    關注

    73

    文章

    5424

    瀏覽量

    120629
收藏 人收藏

    評論

    相關推薦

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計算機視覺技術變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計算機視覺技術變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?358次閱讀

    【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    AI超級計算機的中樞核心。 作者介紹: 濮元愷,曾就職于中關村在線核心硬件事業(yè)部,負責CPU和GPU類產(chǎn)品評測,長期關注GPGPU并行計算相關芯片微架構。目前在量化金融領域,主要負表
    發(fā)表于 09-02 10:09

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型算力中心建設指南

    案例,展示如何針對機器學習應用進行需求分析、設計與實現(xiàn)。 無論是高等院校計算機與人工智能等相關專業(yè)的本科生或研究生,還是對并行計算技術、云計算技術、高性能存儲及高性能網(wǎng)絡
    發(fā)表于 08-16 18:33

    ai服務器是什么架構類型

    架構的AI服務器通常具有較高的通用性,可以運行各種人工智能算法。但是,CPU架構的AI服務器在處理大規(guī)模并行計算時,性能可能不如GPU架構的AI
    的頭像 發(fā)表于 07-02 09:51 ?608次閱讀

    恒訊科技的GPU云解決方案有什么特點和優(yōu)勢?

    GPU云解決方案通常指的是云服務提供商提供的、基于圖形處理單元(GPU)的計算服務。這些服務利用GPU
    的頭像 發(fā)表于 06-12 17:24 ?297次閱讀

    助力科學發(fā)展,NVIDIA AI加速HPC研究

    科學家和研究人員正在利用 NVIDIA 技術將生成式 AI 應用于代碼生成、天氣預報、遺傳學和材料科學領域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?310次閱讀
    助力科學發(fā)展,<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b>加速HPC<b class='flag-5'>研究</b>

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    Blackwell Tensor Core GPU 與1個 NVIDIA Grace CPU 連接,實現(xiàn)高效的計算協(xié)同。GB200 NVL72 同時集成尖端功能和第二代 Transformer 引擎,
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱
    的頭像 發(fā)表于 04-20 09:39 ?524次閱讀

    NVLink技術GPUGPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉換會產(chǎn)生較大延時,影響GPU并行計算的效率和性能。
    發(fā)表于 03-27 09:40 ?2922次閱讀
    NVLink<b class='flag-5'>技術</b>之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    NVIDIA cuPQC幫助開發(fā)適用于量子計算時代的加密技術

    NVIDIA cuPQC 可為相關開發(fā)者提供加速計算支持,幫助開發(fā)適用于量子計算時代的加密技術。cuPQC 庫可利用
    的頭像 發(fā)表于 03-22 09:53 ?315次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算AI 基礎設施

    NVIDIA 軟件實現(xiàn)了跨 ?Blackwell GPU、新交換機和 BlueField-3 SuperNIC 的分布式計算,大幅提升了 AI、數(shù)據(jù)處理、高性能
    發(fā)表于 03-19 10:05 ?265次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> <b class='flag-5'>計算</b>和 <b class='flag-5'>AI</b> 基礎設施

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學研究領域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術大咖帶你深度剖析核心技術,把脈未來科技發(fā)展方向! AI For Science (亦稱 “
    的頭像 發(fā)表于 12-25 18:30 ?824次閱讀
    <b class='flag-5'>NVIDIA</b> 人工智能開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> 助力科學<b class='flag-5'>研究</b>領域的新突破

    gpu服務器是干什么的 gpu服務器與cpu服務器的區(qū)別

     相比于傳統(tǒng)的CPU服務器,GPU服務器支持同時計算大量相似的計算操作,可以實現(xiàn)更強的并行計算性能。GPU服務器通常配備多個高性能的
    的頭像 發(fā)表于 12-02 17:20 ?1738次閱讀

    創(chuàng)新企業(yè)云福利:騰訊云 × NVIDIA 初創(chuàng)加速計劃

    x NVIDIA 初創(chuàng)加速計劃 助您降低產(chǎn)品使用門檻 高性能計算集 群?HCC 以高性能云服務器為節(jié)點,通過 RDMA 互聯(lián),大幅提升網(wǎng)絡性能,提供高帶寬和極低延遲的網(wǎng)絡服務,能滿足大規(guī)模高性能計算、人工智能、大數(shù)據(jù)推薦等應用
    的頭像 發(fā)表于 11-13 20:40 ?490次閱讀
    創(chuàng)新企業(yè)云福利:騰訊云 × <b class='flag-5'>NVIDIA</b> 初創(chuàng)加速計劃

    NVIDIA 校招 | 基礎設施部門正在熱招!

    認識我們 1999 年,NVIDIA ?發(fā)明了 GPU,這極大地推動了 PC ?游戲市場的發(fā)展,重新定義了現(xiàn)代計算機圖形技術,并徹底改變了并行計算
    的頭像 發(fā)表于 10-26 09:05 ?389次閱讀
    <b class='flag-5'>NVIDIA</b> 校招 | 基礎設施部門正在熱招!