0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA TAO工具包和Appen實(shí)現(xiàn)AI模型微調(diào)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者: Titus Capilnean ? 2022-04-13 15:29 ? 次閱讀

從頭開始構(gòu)建人工智能模型需要大量的數(shù)據(jù)、時(shí)間、金錢和專業(yè)知識(shí)。這與在人工智能領(lǐng)域取得成功的條件不符:快速上市,以及快速發(fā)展和定制解決方案的能力。 NVIDIA TAO 是一個(gè)人工智能模型調(diào)整框架,與從頭開始的培訓(xùn)相比,它可以讓您利用生產(chǎn)質(zhì)量、預(yù)培訓(xùn)的人工智能模型,并在很短的時(shí)間內(nèi)對(duì)其進(jìn)行微調(diào)。

要進(jìn)一步微調(diào)這些模型,或確認(rèn)模型的精度,需要額外的高質(zhì)量訓(xùn)練數(shù)據(jù)。 Appen 是 TAO 的數(shù)據(jù)注釋合作伙伴,如果您沒有合適的可用數(shù)據(jù),它可以訪問高質(zhì)量的數(shù)據(jù)集和服務(wù),為您的數(shù)據(jù)添加標(biāo)簽和注釋,以滿足您的獨(dú)特需求。

在帖子中,我將向你展示如何使用 NVIDIA TAO 工具包 一個(gè)基于 CLI 的NVIDIA TAO 框架的解決方案,以及 AppEN 的數(shù)據(jù)標(biāo)記平臺(tái),以簡(jiǎn)化整個(gè)培訓(xùn)過程,并為特定用例創(chuàng)建高度定制的模型。

在您的團(tuán)隊(duì)確定了要使用 ML 解決的業(yè)務(wù)問題后,您可以從 NVIDIA 收集的計(jì)算機(jī)視覺和對(duì)話人工智能中的預(yù)訓(xùn)練人工智能模型中進(jìn)行選擇。計(jì)算機(jī)視覺模型可以包括人臉檢測(cè)模型、文本識(shí)別、分割等。然后,您可以應(yīng)用 TAO 工具包來構(gòu)建、培訓(xùn)、測(cè)試和部署您的解決方案。

為了加快數(shù)據(jù)收集和擴(kuò)充過程,您現(xiàn)在可以使用 Appen 數(shù)據(jù)注釋平臺(tái)為您的用例創(chuàng)建正確的培訓(xùn)數(shù)據(jù)。該強(qiáng)大的平臺(tái)使您能夠訪問 Appen 全球超過 100 萬名熟練的注釋員,他們來自 170 多個(gè)國(guó)家,講 235 種語言。 Appen 的數(shù)據(jù)注釋平臺(tái) 和專業(yè)知識(shí)還為您提供了其他資源:

高質(zhì)量數(shù)據(jù)集(用于需要數(shù)據(jù)時(shí))

全球采購(gòu)的人工標(biāo)簽機(jī),用于為未標(biāo)記的數(shù)據(jù)添加注釋

一個(gè)易于使用的平臺(tái),您可以在其中啟動(dòng)注釋作業(yè)并監(jiān)控關(guān)鍵指標(biāo)

質(zhì)量保證檢查和數(shù)據(jù)安全控制

有了干凈、高質(zhì)量的數(shù)據(jù),您可以調(diào)整 經(jīng)過訓(xùn)練的 NVIDIA 模型以滿足您的需求,并進(jìn)行修剪和再培訓(xùn),以達(dá)到所需的性能水平。

如何使用 Appen 的平臺(tái)準(zhǔn)備數(shù)據(jù)

如果您還沒有用于訓(xùn)練模型的數(shù)據(jù),您可以自己收集這些數(shù)據(jù),也可以求助于 Appen ,找到適合您的用例的源數(shù)據(jù)集。 Appen 數(shù)據(jù)注釋平臺(tái)( ADAP )可使用多種格式:

音頻(. wav ,. mp3 )

圖像(. jpeg ,. png )

文本(. txt )

視頻(網(wǎng)址)

完成數(shù)據(jù)收集階段后,除非您計(jì)劃與 Appen 合作以滿足數(shù)據(jù)收集需求,否則您可以使用 Appen 的平臺(tái)快速標(biāo)記您收集的數(shù)據(jù)。每行數(shù)據(jù)批注都需要 Appen 平臺(tái)許可證和預(yù)算。

在此基礎(chǔ)上,完成以下步驟,部署一個(gè)特別適合您需求的模型。在本文中,假設(shè)您正在為對(duì)象檢測(cè)模型注釋圖像。

準(zhǔn)備好你的數(shù)據(jù)

首先,將圖像數(shù)據(jù)加載到網(wǎng)絡(luò)可訪問的位置:云或 ADAP 可以訪問的位置,例如私有 Amazon S3 存儲(chǔ)桶。

接下來,用兩列結(jié)構(gòu)輸入 CSV 文件。第一列包含文件名,第二列包含圖像的 URL 。您可以通過以下三種方式之一提供 URL :

對(duì)數(shù)據(jù)使用公開可用的 URL 。

使用預(yù)先簽名的 URL 。

使用 Appen 的安全數(shù)據(jù)訪問工具,您可以使用該工具將數(shù)據(jù)庫(kù)安全地連接到平臺(tái); Appen 僅在需要時(shí)訪問您的數(shù)據(jù)。

第二列包含設(shè)備上的本地文件名。圖 1 顯示了 CSV 文件的外觀。

poYBAGJWfAaAbdYuAAHdcm4AAOo145.png

圖 1 。用于 ADAP 中數(shù)據(jù)上傳的 CSV 結(jié)構(gòu)

創(chuàng)建作業(yè)并上載數(shù)據(jù)

如果尚未登錄,可以 創(chuàng)建 ADAP 帳戶 并登錄。在運(yùn)行新作業(yè)之前,您必須擁有平臺(tái)的活動(dòng)許可證。要了解更多有關(guān)計(jì)劃和定價(jià)的信息, 聯(lián)系 Appen 。

登錄后,在Jobs下選擇創(chuàng)造就業(yè)機(jī)會(huì)。

pYYBAGJWfA-ASf2PAACQvL2OgrU139.png

圖 2 。 ADAP 工作概述頁面

選擇最適合工作的模板(情緒分析、搜索相關(guān)性等)。對(duì)于本例,請(qǐng)選擇Image Annotation。

poYBAGJWfBqAApn5AAF4dwi-KDc050.png

圖 3 。 ADAP 作業(yè)模板頁面–圖像注釋

在Image Annotation下,選擇使用邊界框?qū)D像中的對(duì)象進(jìn)行注釋和分類。將 CSV 文件拖放到Upload選項(xiàng)卡中,上傳 CSV 文件。

設(shè)計(jì)你的工作

為 Appen 的 100 多萬名數(shù)據(jù)標(biāo)簽員提供指導(dǎo),說明他們應(yīng)該尋找什么,以及他們應(yīng)該知道的任何要求。該模板提供了一個(gè)簡(jiǎn)單的工作設(shè)計(jì)來幫助您開始。

接下來,選擇管理圖像注釋本體,在這里定義應(yīng)該檢測(cè)的類。更新說明,以提供有關(guān)用例的更多上下文,并描述注釋者應(yīng)如何識(shí)別和標(biāo)記圖像中的對(duì)象。您可以預(yù)覽作業(yè),并查看注釋員將如何查看它。

最后,創(chuàng)建測(cè)試問題來測(cè)量和跟蹤貼標(biāo)機(jī)的性能。

啟動(dòng)作業(yè)

在平臺(tái)上正式啟動(dòng)注釋作業(yè)之前,先進(jìn)行測(cè)試運(yùn)行。在你開始工作后, Appen 的全球數(shù)據(jù)標(biāo)簽員會(huì)根據(jù)你的規(guī)格標(biāo)注你的數(shù)據(jù)。

班長(zhǎng)

實(shí)時(shí)監(jiān)控注釋的準(zhǔn)確率。在工作設(shè)計(jì)、試題或注釋員等領(lǐng)域根據(jù)需要進(jìn)行調(diào)整。

poYBAGJWfCeAfYZVAADzSgJf5hM807.png


pYYBAGJWfECAanZNAADsYgStpvw629.png

圖 8 。 ADAP 注釋進(jìn)度監(jiān)控頁面

后果

選擇Download、Full下載標(biāo)簽數(shù)據(jù)輸出的報(bào)告。

將輸出轉(zhuǎn)換為 KITTI 格式

從這里開始,您需要一個(gè)腳本來將標(biāo)記的數(shù)據(jù)轉(zhuǎn)換為可供 TAO 工具包使用的格式,例如 KITTI 格式。

使用上一步的輸出,可以使用以下部分將標(biāo)記的數(shù)據(jù)轉(zhuǎn)換為類似 Pascal Visual Object Class ( VOC )格式的格式。

訓(xùn)練你的模特

用 Appen 注釋的數(shù)據(jù)現(xiàn)在可以用于訓(xùn)練對(duì)象檢測(cè)模型。 TAO 工具包允許您根據(jù)數(shù)據(jù)調(diào)整流行的網(wǎng)絡(luò)架構(gòu)和主干,從而訓(xùn)練、微調(diào)、刪減和導(dǎo)出高度優(yōu)化和精確的人工智能模型,以供部署。對(duì)于本例,您可以選擇 YOLOV3 對(duì)象檢測(cè)模型,如下例所示:

$ wget --content-disposition https://api.ngc.nvidia.com/v2/resources/nvidia/tlt_cv_samples/versions/v1.0.2/zip -O tlt_cv_samples_v1.0.2.zip $ unzip -u tlt_cv_samples_v1.0.2.zip -d ./tlt_cv_samples_v1.0.2 && rm -rf tlt_cv_samples_v1.0.2.zip && cd ./tlt_cv_samples_v1.0.2

下載筆記本示例后,您可以使用以下命令啟動(dòng)筆記本:

$ jupyter notebook --ip 0.0.0.0 --port 8888 --allow-root

在 localhost 上打開 internet 瀏覽器并打開以下 URL :

http://0.0.0.0:8888

因?yàn)槟趧?chuàng)建一個(gè) YOLOv3 模型,所以打開 yolo _ v3 / yolo _ v3 。 ipynb 筆記本。按照筆記本上的說明訓(xùn)練模型。

根據(jù)結(jié)果,微調(diào)模型,直到達(dá)到度量目標(biāo)。如果需要,您可以在此階段創(chuàng)建自己的主動(dòng)學(xué)習(xí)循環(huán)。根據(jù)置信度或其他選擇指標(biāo),使用 CSV 文件方法對(duì)數(shù)據(jù)進(jìn)行優(yōu)先級(jí)排序,如前面步驟所述。您還可以提前加載數(shù)據(jù)(包括輸入和預(yù)測(cè)),這樣 Appen 的注釋員可以在模型經(jīng)過培訓(xùn)后驗(yàn)證模型,并使用我們的領(lǐng)域?qū)<液?open crowd 查看預(yù)測(cè)。

Pro tip:使用 Appen 解決方案 Workflows 輕松構(gòu)建和自動(dòng)化多步驟數(shù)據(jù)注釋項(xiàng)目。

迭代

隨著您不斷提高模型性能, Appen 可以在后續(xù)的模型培訓(xùn)中進(jìn)一步幫助您進(jìn)行數(shù)據(jù)收集和注釋。為了避免模型漂移或適應(yīng)不斷變化的業(yè)務(wù)需求,請(qǐng)定期對(duì)模型進(jìn)行再培訓(xùn)。

結(jié)論

NVIDIATAO 工具包與 Appen 的數(shù)據(jù)平臺(tái)相結(jié)合,使您能夠訓(xùn)練、微調(diào)和優(yōu)化預(yù)訓(xùn)練模型,以更快地啟動(dòng)人工智能解決方案。在不犧牲質(zhì)量的情況下,將開發(fā)時(shí)間縮短十倍。在NVIDIA 和 Appen 的綜合專業(yè)知識(shí)和工具的幫助下,您將滿懷信心地推出人工智能。

關(guān)于作者

Titus Capilnean 領(lǐng)導(dǎo) Appen 的營(yíng)銷傳播,推動(dòng)負(fù)責(zé)任、包容的人工智能,并與全球公司進(jìn)行培訓(xùn)數(shù)據(jù)對(duì)話。他擁有 2016 年的機(jī)器學(xué)習(xí)證書、霍爾特國(guó)際商學(xué)院( Hult International Business School )的行政 MBA 學(xué)位,并在 Forbes 上發(fā)表了幾篇關(guān)于人工智能的評(píng)論文章。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46696

    瀏覽量

    237180
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于NVIDIA TAO工具包訓(xùn)練汽車目標(biāo)識(shí)別模型

    2023年以ChatGPT為代表的大語言模型橫空出世,它的出現(xiàn)標(biāo)志著自然語言處理領(lǐng)域取得了重大突破。它在文本生成、對(duì)話系統(tǒng)和語言理解等方面展現(xiàn)出了強(qiáng)大的能力,為人工智能技術(shù)的發(fā)展開辟了新的可能性。同時(shí),人工智能技術(shù)正在進(jìn)入各種應(yīng)用領(lǐng)域,在智慧城市、智能制造、智慧醫(yī)療、智慧農(nóng)業(yè)等領(lǐng)域發(fā)揮著重要作用。
    的頭像 發(fā)表于 11-07 10:53 ?125次閱讀
    基于<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TAO</b><b class='flag-5'>工具包</b>訓(xùn)練汽車目標(biāo)識(shí)別<b class='flag-5'>模型</b>

    FPGA仿真工具包軟件EasyGo Vs Addon介紹

    EasyGo Vs Addon是一款領(lǐng)先的FPGA仿真工具包軟件,它強(qiáng)大地連接了VeriStand軟件與Matlab/Simulink,為實(shí)時(shí)測(cè)試和驗(yàn)證領(lǐng)域帶來了前所未有的便利和效率,特別適用于汽車、航空航天和能源電力等實(shí)時(shí)測(cè)試和驗(yàn)證至關(guān)重要的行業(yè)。
    的頭像 發(fā)表于 10-24 15:55 ?211次閱讀
    FPGA仿真<b class='flag-5'>工具包</b>軟件EasyGo Vs Addon介紹

    采用德州儀器 (TI) 工具包進(jìn)行模擬前端設(shè)計(jì)應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《采用德州儀器 (TI) 工具包進(jìn)行模擬前端設(shè)計(jì)應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-09 11:21 ?0次下載
    采用德州儀器 (TI) <b class='flag-5'>工具包</b>進(jìn)行模擬前端設(shè)計(jì)應(yīng)用說明

    NVIDIA RTX AI套件簡(jiǎn)化AI驅(qū)動(dòng)的應(yīng)用開發(fā)

    NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的
    的頭像 發(fā)表于 09-06 14:45 ?376次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的
    發(fā)表于 07-24 09:39 ?675次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    AI模型AI框架的關(guān)系

    多個(gè)領(lǐng)域取得顯著成果。而AI框架則是為開發(fā)和訓(xùn)練AI模型提供的一套標(biāo)準(zhǔn)接口、特性庫(kù)和工具包,它集成了算法的封裝、數(shù)據(jù)的調(diào)用以及計(jì)算資源的使用,是AI
    的頭像 發(fā)表于 07-15 11:42 ?885次閱讀

    模型為什么要微調(diào)?大模型微調(diào)的原理

    在人工智能(AI)領(lǐng)域,特別是自然語言處理(NLP)領(lǐng)域,大模型(如BERT、GPT系列等)的出現(xiàn)為許多復(fù)雜任務(wù)提供了強(qiáng)大的解決方案。然而,這些預(yù)訓(xùn)練的大模型雖然具有廣泛的適用性,但在特定任務(wù)上往往
    的頭像 發(fā)表于 07-10 10:43 ?3308次閱讀

    MediaTek與NVIDIA TAO加速物聯(lián)網(wǎng)邊緣AI應(yīng)用發(fā)展

    在即將到來的COMPUTEX 2024科技盛會(huì)上,全球知名的芯片制造商MediaTek宣布了一項(xiàng)重要合作——將NVIDIATAO(TensorRT Accelerated Optimizer)與其NeuroPilot SDK(軟件開發(fā)
    的頭像 發(fā)表于 06-12 14:49 ?434次閱讀

    Edge Impulse發(fā)布新工具,助 NVIDIA 模型大規(guī)模部署

    借助 Edge Impulse 和 NVIDIA TAO 工具包的協(xié)同效應(yīng),工程師得以快速構(gòu)建并部署至邊緣優(yōu)化硬件(如上述型號(hào))的計(jì)算機(jī)視覺模型。該平臺(tái)還支持用戶運(yùn)用經(jīng)由 GPU 優(yōu)化
    的頭像 發(fā)表于 03-25 16:00 ?673次閱讀

    QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包

    電子發(fā)燒友網(wǎng)站提供《QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包.pdf》資料免費(fèi)下載
    發(fā)表于 02-19 10:44 ?0次下載
    QE for Motor V1.3.0:汽車開發(fā)輔助<b class='flag-5'>工具</b>解決方案<b class='flag-5'>工具包</b>

    NVIDIA TAO 5.2版本發(fā)布

    NVIDIA TAO 提供了一個(gè)低代碼開源 AI 框架,無論你是初學(xué)者還是專業(yè)的數(shù)據(jù)科學(xué)家,都可以使用該框架加速視覺 AI 模型開發(fā)。開發(fā)者
    的頭像 發(fā)表于 01-03 10:11 ?579次閱讀

    怎樣使用NVIDIA TAO為數(shù)萬億臺(tái)設(shè)備開發(fā)和優(yōu)化視覺AI模型呢?

    全球開發(fā)者正在使用 NVIDIA TAO 工具套件構(gòu)建 AI 視覺感知和計(jì)算機(jī)視覺應(yīng)用。如今,得益于顯著的平臺(tái)增強(qiáng)和生態(tài)對(duì)其的大力采用,這一過程比以往任何時(shí)候都更快、更容易。
    的頭像 發(fā)表于 12-14 15:55 ?465次閱讀

    用上這個(gè)工具包,大模型推理性能加速達(dá)40倍

    作者: 英特爾公司 沈海豪、羅嶼、孟恒宇、董波、林俊 編者按: 只需不到9行代碼, 就能在CPU上實(shí)現(xiàn)出色的LLM推理性能。 英特爾 ?Extension for Transformer 創(chuàng)新工具包
    的頭像 發(fā)表于 12-01 20:40 ?1086次閱讀
    用上這個(gè)<b class='flag-5'>工具包</b>,大<b class='flag-5'>模型</b>推理性能加速達(dá)40倍

    為IoT和IIoT應(yīng)用選擇微控制器開發(fā)工具包的介紹性指南

    為IoT和IIoT應(yīng)用選擇微控制器開發(fā)工具包的介紹性指南
    的頭像 發(fā)表于 11-30 15:51 ?508次閱讀
    為IoT和IIoT應(yīng)用選擇微控制器開發(fā)<b class='flag-5'>工具包</b>的介紹性指南

    NVIDIA 通過企業(yè)級(jí)生成式 AI 微服務(wù)為聊天機(jī)器人、AI 助手和摘要工具帶來商業(yè)智能

    Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實(shí)現(xiàn)準(zhǔn)確的 AI 推理 NVIDIA 今日宣布推出一項(xiàng)
    的頭像 發(fā)表于 11-29 21:05 ?578次閱讀