0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SOK將HugeCTR中的高級特性進行包裝使用

星星科技指導員 ? 來源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀

1. Introduction

HugeCTR 能夠高效地利用 GPU 來進行推薦系統(tǒng)的訓練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開發(fā)了 SparseOperationKit (SOK),來將 HugeCTR 中的高級特性封裝為 TensorFlow 可直接調用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級特性來加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內部做黑盒式地模型轉換,最后將計算結果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個 GPU 上進行擴展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實際需求提供了對應的新解決方案,比如說 GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標準模型 DLRM 來對 SOK 的性能進行測試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓練速度以及更高的吞吐量。

3. API

SOK 提供了簡潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡單、直接;讓用戶通過修改幾行代碼就可以使用 SOK。

定義模型結構

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側是使用 TensorFlow 的 API 來搭建模型,右側是使用 SOK 的 API 來搭建相同的模型。使用 SOK 來搭建模型的時候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對應的 API 即可。

使用 Horovod 來定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側是使用 TensorFlow 來定義 training loop,右側是使用 SOK 時,training loop 的定義方式??梢钥吹?,使用 SOK 時,只需要對 Embedding Variables 和 Dense Variables 進行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來定義 training loop。

開始訓練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開始訓練過程時,使用 SOK 與使用 TensorFlow 時所用代碼完全一致。

4. 結語

SOK 將 HugeCTR 中的高級特性包裝為 TensorFlow 可以直接使用的模塊,通過修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進設計。

關于作者

NVIDIA GPU 計算專家研發(fā)團隊成立于2020年7月,主要面向全球用戶開發(fā)基于英偉達通用計算產品的軟件解決方案。 目前團隊致力于推薦系統(tǒng)訓練框架 Merlin HugeCTR的開發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對于推薦系統(tǒng)設計的模型訓練框架。項目啟動于2018年,目前產品應用于多家國際互聯(lián)網公司,自2020年以來,HugeCTR持續(xù)參與并推動國際性競賽MLPerf DLRM訓練項目,從而實現(xiàn)了業(yè)界領先的優(yōu)化性能。 NVIDIA GPU 計算專家研發(fā)團隊是一個小型國際化工程團隊,核心成員來自于多個國家(中國,韓國,荷蘭,德國),客戶分布于世界各地。日常工作使用英語溝通。 團隊主要工作圍繞軟件產品開發(fā)展開,涉及產品維護、文檔、測試、發(fā)布、部署,日常工作中與各國硬件、產品、工程、客戶支持團隊有著緊密的合作。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4793

    瀏覽量

    102429
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4591

    瀏覽量

    128144
收藏 人收藏

    評論

    相關推薦

    MT6835 磁編碼 IC 技術在全自動紙包裝的應用

    一、引言 在現(xiàn)代包裝行業(yè),效率和精度是衡量生產設備性能的關鍵指標。全自動紙包裝機作為包裝生產線的重要設備,其性能的優(yōu)劣直接影響到產品的
    的頭像 發(fā)表于 08-15 16:34 ?142次閱讀
    MT6835 磁編碼 IC 技術在全自動紙<b class='flag-5'>包裝</b>機<b class='flag-5'>中</b>的應用

    宏工科技發(fā)力包裝領域,解決超細粉料包裝難點

    宏工科技不斷在物料處理鏈條上加大研發(fā)力度,攻克了一系列“卡脖子”技術難題,以技術創(chuàng)新鑄就宏工的“品牌力”。以包裝領域為例,針對不同的包裝需求,宏工科技目前在工業(yè)包裝領域已推出了噸袋包裝
    的頭像 發(fā)表于 08-15 14:54 ?204次閱讀
    宏工科技發(fā)力<b class='flag-5'>包裝</b>領域,解決超細粉料<b class='flag-5'>包裝</b>難點

    熱收縮膜包裝機的主要作用

    熱收縮膜包裝機又稱熱收縮包裝機(也稱為收縮包裝機、熱收縮機、收縮機、膜包機等),主要作用是產品用熱收縮薄膜裹包后再進行加熱,使薄膜收縮后
    的頭像 發(fā)表于 08-15 11:43 ?358次閱讀

    SOK在手機行業(yè)的應用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關特性
    的頭像 發(fā)表于 07-25 10:01 ?203次閱讀
    <b class='flag-5'>SOK</b>在手機行業(yè)的應用案例

    用于物料包裝成口袋狀的機械設備口袋包裝

    包裝
    jf_17886177
    發(fā)布于 :2024年07月15日 16:03:25

    元器件的包裝方式及常見的四種方式

    四種元件包裝方式在實際生產和使用中廣泛應用,不同的包裝方式適用于不同類型和規(guī)格的元件,并且可以根據(jù)具體要求進行定制化的包裝設計。不同的包裝
    的頭像 發(fā)表于 06-27 12:58 ?600次閱讀

    機器視覺檢測:薯愿外包裝檢測

    食品及包裝行業(yè)中常常需要對產品的包裝盒、包裝袋表面進行缺陷檢測,其檢測內容包括產品混料、外包裝破損、臟污等,機器視覺技術能夠通過拍照或掃描取
    的頭像 發(fā)表于 05-08 13:36 ?296次閱讀
    機器視覺檢測:薯愿外<b class='flag-5'>包裝</b>檢測

    激光打標機在食品包裝行業(yè)的應用與優(yōu)勢

    激光打標機在食品包裝行業(yè)的應用與優(yōu)勢如下:應用:1.激光打標機可以用于食品包裝袋、瓶蓋、罐頭等包裝材料的打標和雕刻,打印生產日期、保質期、批次號、二維碼等信息。2.激光打標機還可以用
    的頭像 發(fā)表于 02-27 18:05 ?372次閱讀
    激光打標機在食品<b class='flag-5'>包裝</b>行業(yè)<b class='flag-5'>中</b>的應用與優(yōu)勢

    自動稱重包裝機如何數(shù)據(jù)采集到云平臺進行監(jiān)控管理

    企業(yè)的生產管理,數(shù)據(jù)采集和監(jiān)控管理起著至關重要的作用。 云平臺是一種基于互聯(lián)網的計算方式,可以提供彈性計算、存儲和應用服務。將自動稱重包裝機的數(shù)據(jù)采集到云平臺,可以實現(xiàn)對生產數(shù)據(jù)的實時監(jiān)控、遠程管理和智能
    的頭像 發(fā)表于 02-20 15:42 ?323次閱讀
    自動稱重<b class='flag-5'>包裝</b>機如何數(shù)據(jù)采集到云平臺<b class='flag-5'>進行</b>監(jiān)控管理

    熱收縮膜包裝機數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)如何實現(xiàn)

    熱收縮膜包裝機是一種使用熱收縮膜對產品進行包裝的設備。它的工作原理是先將熱收縮膜加熱至軟化狀態(tài)并緊緊地包裹在產品上,最后通過快速冷卻使膜收縮并固化,從而緊緊地貼合在產品表面,形成緊密、透明的包裝效果
    的頭像 發(fā)表于 01-23 17:15 ?302次閱讀
    熱收縮膜<b class='flag-5'>包裝</b>機數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)如何實現(xiàn)

    modbus TCP轉CAN連接良好的包裝機,快速實施,無需編程使命必達。

    任何工業(yè)設備集成到其包裝,并與其控制系統(tǒng)進行通信。此外,我們還為客戶提供技術支持安全遠程訪問以進行故障排除,滿足客戶自由選擇他們的設備
    的頭像 發(fā)表于 01-10 10:59 ?342次閱讀

    漲知識了!元器件包裝標簽的“e”代碼,原來是這個含義……

    漲知識了!元器件包裝標簽的“e”代碼,原來是這個含義……
    的頭像 發(fā)表于 12-06 15:43 ?968次閱讀

    電源適配器的包裝和運輸過程需要注意哪些事項?

    電源適配器的包裝和運輸過程需要注意哪些事項? 電源適配器是電子產品必不可少的一部分,而包裝和運輸對于保證產品的完好還原以及減少損壞都有著至關重要的作用。所以,在電源適配器的
    的頭像 發(fā)表于 11-23 14:38 ?939次閱讀

    真空充氮包裝機遠程監(jiān)控運維平臺解決方案

    物品的保質期,并提高它們的保存質量。真空充氮包裝機集制氮氣、抽真空、充氮氣、熱封多種功能為一體的設備,過程涉及真空度、工作壓力、氮氣濃度、包裝速度、重量、產量及電機電壓電流等參數(shù)等,需要實時監(jiān)控并
    的頭像 發(fā)表于 11-02 14:36 ?615次閱讀
    真空充氮<b class='flag-5'>包裝</b>機遠程監(jiān)控運維平臺解決方案

    DINA產品案例:包裝行業(yè)的解決方案

    日常生活包裝形形色色,無論是袋裝還是紙盒裝,都需要包裝機器來進行生產,為了能夠安全地控制系統(tǒng),需要對急停電路進行實時的中央監(jiān)控,DINA
    的頭像 發(fā)表于 10-20 15:00 ?639次閱讀
    DINA產品案例:<b class='flag-5'>包裝</b>行業(yè)的解決方案