0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTRV 3.8/3.9版本新增內(nèi)容

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-24 10:12 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計點(diǎn)擊率(Click-through rate)。

V3.8 版本新增內(nèi)容

1. 第三代 Embedding 的示例:

這個版本我們新增了一個示例筆記本,介紹了 Embedding 集合的 Python API 以及第三代 Embedding 的使用方法。

2. 用于分級參數(shù)服務(wù)器查找功能的 DLPack Python API:

這個版本我們引入了對使用 DLPack Python API 從分層參數(shù)服務(wù)器 (HPS) 查找 Embedding 的支持。新方法是 lookup_fromdlpack()。

3. 使用 Python API 從 HDFS 讀取 Parquet 數(shù)據(jù)集:

現(xiàn)在您可以通過 DataSourceParams 來指定 Data Reader 的數(shù)據(jù)源的配置了,例如 Hadoop 分布式文件系統(tǒng)的 NameNode 的主機(jī)名和 NameNode 端口號。

4. 提高了日志記錄的性能。

5. 層類的改進(jìn):

全連接層現(xiàn)已支持 3 維輸入,Matrix Multiply 層現(xiàn)已支持 4 維輸入。

6. 文檔的改進(jìn):

a. 增加了導(dǎo)航長頁面以提供更好的體驗。

b. Criteo 1TB 點(diǎn)擊日志數(shù)據(jù)集的 URL 已更新。

7. 修復(fù)的問題:

修復(fù)了 _metadata.json 配置文件內(nèi)的文件名和實(shí)際數(shù)據(jù)集文件名不一致的問題。

修復(fù)了在 AUC 預(yù)熱期間在多個 GPU 上運(yùn)行大型模型時發(fā)生的內(nèi)存崩潰問題。

修復(fù)了 ETC 筆記本中鍵集生成的問題。

修復(fù)了使用調(diào)試模式編譯時發(fā)生的編譯錯誤。

修復(fù)多節(jié)點(diǎn)訓(xùn)練出現(xiàn)重復(fù)日志的問題。

V3.9 版本新增內(nèi)容

1. 第三代 Embedding 的更新:

更新了 SOK 以使用 HugeCTR 第三代 Embedding 作為開發(fā)者預(yù)覽版本。

啟用了基于 cuCollection的動態(tài)Embedding 模式。動態(tài)的Embedding能夠在用戶不配置內(nèi)存使用信息時自動拓展。

2. 全新的多節(jié)點(diǎn)訓(xùn)練教程

我們提供了一個全新的基于 HugeCTR 最新 Docker 容器使用多節(jié)點(diǎn)訓(xùn)練的實(shí)例。

3. 現(xiàn)已支持 MMoE 模型的離線推理并提供了 Per-class AUC 和平均 AUC 計算。

4. 對 HPS TensorFlow 插件使用的文檔和實(shí)例更新:

一個新的簡介文檔。

新的實(shí)例筆記本。

新的API文檔。

5. 修復(fù)的問題:

修復(fù)了一個訓(xùn)練性能受到 GPU 例程檢查影響的問題。該例程檢查輸入的 key 是否在規(guī)定的 Embedding Table 范圍內(nèi)。對于可以保證輸入的 key 能放在指定的 workspace_size_per_gpu_in_mb 的情況,我們提供了一種解決方法:通過設(shè)置環(huán)境變量 HUGECTR_DISABLE_OVERFLOW_CHECK=1 來關(guān)閉例程檢查,以便恢復(fù)訓(xùn)練性能。

我們修復(fù)了一個 Softmax 層的正確性問題。

我們刪除了一個未更新且不再使用的內(nèi)聯(lián)分析器。

已知問題

以下是目前HugeCTR存在的已知問題,我們將在之后的版本中盡快修復(fù)。

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時,建議您通過發(fā)出以下命令來增加這些資源 -shm-size=1g -ulimit memlock=-1

另見 NCCL 的 已知問題。

還有 GitHub 問題。

目前即使目標(biāo) Kafka broker 無響應(yīng),KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 data reader worker 將被映射到同一個文件,導(dǎo)致數(shù)據(jù)加載不會按預(yù)期進(jìn)行。

正則化器暫時不支持聯(lián)合損失訓(xùn)練。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4590

    瀏覽量

    128134
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84068
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    461

    瀏覽量

    16232

原文標(biāo)題:HugeCTR v3.8 & v3.9 發(fā)布說明

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    USB4 2.0版本的重大更新

    USB版本一直很多,可以說是五花八門,但是隨著接口的日漸統(tǒng)一,USB的版本可以說減少了很多,到了USB4,只剩下USB-C接口,為何還有一個2.0版本,我們往下詳解。
    的頭像 發(fā)表于 09-09 14:37 ?294次閱讀

    【2K0300先鋒板】【v1.0.240725版本】BSP 更新,歡迎更新使用

    更新涉及的內(nèi)容: 1.u-boot 2.kernel 3.文件系統(tǒng) 4.用戶手冊 5.開發(fā)虛擬機(jī) u-boot: 支持單獨(dú)燒錄的dtb文件 默認(rèn)支持 7\'LCD(1024*600) 支持AB系統(tǒng)
    發(fā)表于 08-05 19:09

    微軟發(fā)布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發(fā)布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發(fā)布的 PPT/Word 插件之后, 完成了對 Office 核心使用場景的全方位覆蓋,讓用戶擁有更加輕松的創(chuàng)作體驗。
    的頭像 發(fā)表于 06-27 09:26 ?467次閱讀

    ENV-Windows v2.0.0版本發(fā)布

    ENV-Windows v2.0.0版本發(fā)布
    的頭像 發(fā)表于 06-26 08:35 ?366次閱讀
    ENV-Windows v2.0.0<b class='flag-5'>版本</b>發(fā)布

    LwIP v2.0版本更換為v2.1.2版本后接收不到數(shù)據(jù)了怎么解決?

    請教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數(shù)據(jù)了,是怎么回事啊 ?? 之前使用 v2.0 版本測試是完全可以了,不過目前 使用 v2.1.2版本的,dhc
    發(fā)表于 04-23 08:20

    美國Merlin公司加速自主飛行模擬器開發(fā)

    美國Merlin公司正全力加速自主飛行模擬器的開發(fā)進(jìn)程,以推動航空領(lǐng)域的創(chuàng)新與發(fā)展。這一舉措不僅體現(xiàn)了Merlin公司在技術(shù)研發(fā)方面的雄厚實(shí)力,也預(yù)示著自主飛行技術(shù)即將迎來新的突破。
    的頭像 發(fā)表于 04-22 11:30 ?471次閱讀

    蘋果停iOS 16.7.6驗證,僅支持16.7.7版本驗證

    據(jù)悉,蘋果已于4月17日停止了對iOS 16.7.6版本的驗證服務(wù)。對于已升級至iOS 16.7.7版本的iPhone用戶來說,他們已無法返回至舊版系統(tǒng)。
    的頭像 發(fā)表于 04-17 10:27 ?911次閱讀

    機(jī)智云“智家”APP V4.4.22版本發(fā)布

    新功能上線版本更新親愛的機(jī)友們,迎來了機(jī)智云智家APP全新版本V4.4.22的發(fā)布!此次更新,我們?yōu)槟鷰砹艘幌盗袑?shí)用的功能優(yōu)化和全新的體驗,讓智能生活更加便捷、智慧!更新內(nèi)容一覽01單設(shè)備分享優(yōu)化
    的頭像 發(fā)表于 03-16 08:09 ?308次閱讀
    機(jī)智云“智家”APP V4.4.22<b class='flag-5'>版本</b>發(fā)布

    PSOC Creator由3.3版本升級到4.1版本后,程序的EEEPROM模塊無法使用怎么解決?

    PSOC Creator由3.3版本升級到4.1版本后,程序的EEEPROM模塊無法使用,請?zhí)峁┮幌翪Y8C4247讀寫內(nèi)部Flash的例程,謝謝 。
    發(fā)表于 02-01 06:58

    Vivado 2023.2版本新增功能

    Vivado在前一段時間更新了2023.2版本,經(jīng)過一段時間的使用這個版本還是很絲滑的,用起來挺舒服。
    的頭像 發(fā)表于 01-02 09:39 ?2251次閱讀
    Vivado 2023.2<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b>功能

    OpenHarmony 4.0 Release版本發(fā)布,新增4000+ API

    近日,OpenHarmony 4.0 Release版本如期發(fā)布,開發(fā)套件同步升級到API 10。相比3.2 Release版本,OpenHarmony 4.0 Release版本新增
    的頭像 發(fā)表于 11-13 11:31 ?720次閱讀

    NVIDIA Merlin 助力陌陌推薦業(yè)務(wù)實(shí)現(xiàn)高性能訓(xùn)練優(yōu)化

    通過 Merlin 大幅提升大規(guī)模深度多目標(biāo)精排模型訓(xùn)練性能 本案例中,NVIDIA 團(tuán)隊與陌陌推薦系統(tǒng)團(tuán)隊深度合作,共同使用 NVIDIA GPU 和 Merlin 軟件解決方案替代其原有
    的頭像 發(fā)表于 11-09 10:45 ?266次閱讀
    NVIDIA <b class='flag-5'>Merlin</b> 助力陌陌推薦業(yè)務(wù)實(shí)現(xiàn)高性能訓(xùn)練優(yōu)化

    Moku 3.1版本升級!Moku:Lab、Moku:Pro新增支持邏輯分析儀

    Moku:Lab、Moku:Pro新增支持邏輯分析儀多儀器并行模式支持同時多窗口界面交互!LiquidInstruments宣布發(fā)布Moku3.1版本重要升級。此次更新對Moku:Pro、Moku
    的頭像 發(fā)表于 11-03 08:16 ?352次閱讀
    Moku 3.1<b class='flag-5'>版本</b>升級!Moku:Lab、Moku:Pro<b class='flag-5'>新增</b>支持邏輯分析儀

    collections:一款強(qiáng)大的內(nèi)置容器

    )中,后續(xù)將在python3.9版本全部整合至collections.abc模塊。 collections模塊提供了9種容器類型 (適用于python3.8及更早版本) collect
    的頭像 發(fā)表于 11-01 11:38 ?6489次閱讀
    collections:一款強(qiáng)大的內(nèi)置容器

    ?Python 3.8:海象運(yùn)算符的三種用法

    Python 版本發(fā)展非常快,如今最新的版本已經(jīng)是 Pyhton 3.9,即便如此,有很多人甚至還停留在 3.6 或者 3.7,連 3.8 還沒用上。 很多 Python
    的頭像 發(fā)表于 10-21 11:07 ?384次閱讀