0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-06-14 18:35 ? 次閱讀

NVIDIA 計算架構(gòu)團(tuán)隊和NVIDIA 計算專家團(tuán)隊正在熱招!

如果你對加速計算領(lǐng)域充滿熱情,并且希望與優(yōu)秀的技術(shù)專家一起合作,那么這個機(jī)會將是你展現(xiàn)才華的優(yōu)質(zhì)平臺,快來加入!

NVIDIA 計算架構(gòu)團(tuán)隊

熱門崗位:

簡歷請投遞至:

sh-recruitment@nvidia.com

Deep Learning Performance Architect - Triton / LLM - TensorRT

工作內(nèi)容:圍繞深度學(xué)習(xí)端到端 AI 軟件全棧,包括但不限于:訓(xùn)練框架、核心計算庫、推理優(yōu)化工具(比如 TensorRT)、AI 編譯器、模型壓縮等全棧軟件棧,以及可以在 AI 軟件全?;A(chǔ)上影響到下一代甚至下兩代硬件架構(gòu)的特性設(shè)計。

技能要求: 良好 C++ 編程,熟悉 AI 軟件棧底層或者計算機(jī)體系結(jié)構(gòu),熟悉上層算法Python 是加分項。

工作地點(diǎn):北京 / 上海

Deep Learning Performance Architect - TensorRT

工作內(nèi)容:NVIDIA 深度學(xué)習(xí)推理引擎 TensorRT 的設(shè)計、開發(fā)和維護(hù)工作(比如,TensorRT 模型導(dǎo)入的流程和相關(guān)工具,圖優(yōu)化,算子的 CUDA 實(shí)現(xiàn)及代碼生成,算子性能優(yōu)化等),以及對當(dāng)前主流的深度學(xué)習(xí)模型使用 TensorRT 進(jìn)行推理的性能進(jìn)行分析和優(yōu)化。同時,還將與 NVIDIA GPU 體系結(jié)構(gòu)設(shè)計團(tuán)隊合作,來推動 NVIDIA 深度學(xué)習(xí)解決方案的軟硬件協(xié)同設(shè)計和研發(fā)。

技能要求:熟練掌握 C++ 編程。


加分技能 / 經(jīng)驗: 度學(xué)習(xí)框架 / 深度學(xué)習(xí)編譯器開發(fā),性能分析 / 建模 / 優(yōu)化相關(guān)的方法論 / 工具,計算機(jī)體系結(jié)構(gòu)相關(guān)知識,CUDA kernel 開發(fā) / 優(yōu)化。

工作地點(diǎn):上海 / 北京


Deep Learning Performance Architect - Operator

工作內(nèi)容:針對不同 GPU 架構(gòu)為 TensorRT、cuDNN、cuBLAS2、cuSPARSE 等深度學(xué)習(xí)算子庫提供高性能基礎(chǔ)算子以及算子融合實(shí)現(xiàn),包含在線代碼生成,代碼融合等相關(guān)開發(fā)工作,以及根據(jù)當(dāng)代 GPU 優(yōu)化瓶頸影響后續(xù)硬件架構(gòu)特征設(shè)計和驗證工作。

技能要求:良好 C++ 編程、熟悉計算機(jī)體系結(jié)構(gòu),有 TVM、MLIR 相關(guān)開發(fā)經(jīng)驗是加分項。

工作地點(diǎn):上海 / 北京

Deep Learning Performance Architect

工作內(nèi)容:圍繞運(yùn)算架構(gòu)的全棧優(yōu)化,包括但不限于:深度學(xué)習(xí)模型分析與預(yù)測、架構(gòu)的性能分析、編譯器性能分析,以及對主流運(yùn)算架構(gòu)和軟件生態(tài)的分析。使 NVIDIA 軟件生態(tài)與計算架構(gòu)更好的支持主流應(yīng)用。

技能要求:良好 C++ / Python 編程,熟悉 AI 軟件或者計算機(jī)體系結(jié)構(gòu)。

工作地點(diǎn):上海

上下滑動查看更多職位詳情

團(tuán)隊介紹

算力是 AI 時代的基礎(chǔ)設(shè)施,而“后摩爾定律時代”,軟硬件協(xié)同設(shè)計,才是加速計算的未來!

NVIDIA 計算架構(gòu)團(tuán)隊歷經(jīng) CUDA 并行編程模型從起步至今的所有階段,其間參與了數(shù)代通用 GPU 計算架構(gòu)及之上的包括 cuDNN、TensorRT、底層高性能算子、并行編程語言在內(nèi)的加速軟件棧的研發(fā)工作。該團(tuán)隊同時參與關(guān)鍵機(jī)器學(xué)習(xí)模型的算法及框架優(yōu)化。

目前,該團(tuán)隊開放多個職位等你的加入!與我們共同書寫下一代 AI 計算架構(gòu)的未來!

NVIDIA 計算架構(gòu)團(tuán)隊旨在推動算法、并行編程模型、核心加速軟件庫及 GPU 體系結(jié)構(gòu)的協(xié)同設(shè)計和演化,在高速發(fā)展的深度學(xué)習(xí)算法與 GPU 硬件體系結(jié)構(gòu)之間建立橋梁,并研發(fā)先進(jìn)的軟硬件協(xié)同的加速計算解決方案。

該團(tuán)隊從高性能計算、深度學(xué)習(xí)、自動駕駛等計算應(yīng)用領(lǐng)域出發(fā),跟蹤學(xué)界、工業(yè)界前沿算法,并掌握其發(fā)展方向;通過對前沿算法(比如:神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu))的深入理解,分析并提出芯片架構(gòu)的需求,包含指令集、編程模型、計算能力、訪存帶寬、片上存儲、片上網(wǎng)絡(luò)及網(wǎng)絡(luò)互聯(lián)等。

同時,承擔(dān)基于架構(gòu)的計算加速軟件棧的開發(fā)及產(chǎn)品化工作。自底層加速核心算子開發(fā)及優(yōu)化,基于硬件加速的并行編程模型的研發(fā)和編譯,TensorRT、cuDNN 等核心加速庫,直到上層訓(xùn)練框架、編譯優(yōu)化。以及,針對模型的混合精度、稀疏矩陣訓(xùn)練及量化方法開發(fā)。

上下滑動查看更多詳情

團(tuán)隊發(fā)展

該團(tuán)隊基于硬件架構(gòu)開發(fā)軟件、編程模型、算法實(shí)現(xiàn),通過算法、軟件開發(fā)實(shí)踐反饋并推動硬件架構(gòu)優(yōu)化,形成閉環(huán),最終實(shí)現(xiàn)軟件、編程模型及硬件架構(gòu)的協(xié)同演化和迭代,達(dá)到極致計算加速的目標(biāo):

  • 建立下一代芯片性能模型、搭建芯片性能分析平臺、調(diào)研下一代芯片新特性

  • 研發(fā)及設(shè)計新的加速指令、開發(fā)原型代碼及編程模型、迭代優(yōu)化下一代芯片架構(gòu)

  • 跟蹤下一代芯片新特性在應(yīng)用中的落地實(shí)現(xiàn)(算子實(shí)現(xiàn)、編譯等)

  • 開發(fā)集成最終軟件產(chǎn)品庫 - TensorRT,cuDNN

  • 優(yōu)化訓(xùn)練框架(MLPerf 各項優(yōu)化)

  • 開發(fā)混合精度、稀疏矩陣及量化方法

上下滑動查看更多詳情

NVIDIA 計算專家團(tuán)隊

熱門崗位:

簡歷請投遞至:

sh-recruitment@nvidia.com

Developer Technology Engineer

工作內(nèi)容:

  • 包括大語言模型、生成式 AI、推薦系統(tǒng)在內(nèi)的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析領(lǐng)域新技術(shù),以及編程實(shí)現(xiàn)、優(yōu)化、模型、算法等方面的研究和開發(fā);

  • 工業(yè)界實(shí)際應(yīng)用的深度分析和優(yōu)化,以保證該類應(yīng)用在當(dāng)前和未來的 NVIDIA 架構(gòu)上都能保持卓越性能;

  • 為關(guān)鍵客戶(業(yè)界頭部公司)提供合適的 AI 解決方案;

  • 和 GPU / CPU / DPU 架構(gòu)團(tuán)隊、研究團(tuán)隊、應(yīng)用庫和開發(fā)工具團(tuán)隊、系統(tǒng)軟件團(tuán)隊等緊密合作來影響下一代產(chǎn)品架構(gòu)、軟件平臺和編程模式的設(shè)計與開發(fā);

  • 與世界各地的優(yōu)秀同事一起助力深度學(xué)習(xí)技術(shù)在互聯(lián)網(wǎng)、交通、金融、醫(yī)療等各領(lǐng)域的落地。

基本要求:

  • 計算機(jī)科學(xué)相關(guān)專業(yè)優(yōu)秀碩士、博士畢業(yè)生;

  • 擁有良好的 C / C++ / Python 編程能力,良好的軟件設(shè)計和開發(fā)能力;

  • (二選一)有并行計算編程基礎(chǔ),有 CUDA / C / C++ / Python 編程經(jīng)驗;

  • (二選一)擁有深度學(xué)習(xí),機(jī)器學(xué)習(xí)領(lǐng)域的扎實(shí)理論基礎(chǔ),熟悉常見的深度學(xué)習(xí)網(wǎng)絡(luò)或機(jī)器學(xué)習(xí)算法;

  • 良好的溝通能力、解決問題能力、時間管理能力和任務(wù)優(yōu)先級管理能力;

  • 良好的英文技術(shù)文檔讀寫能力和日常聽說溝通能力。

工作地點(diǎn):北京 / 上海 / 深圳 / 臺北

上下滑動查看更多職位詳情

團(tuán)隊介紹

NVIDIA 計算專家團(tuán)隊(DevTech)專注于各種深度學(xué)習(xí)算法、科學(xué)計算、數(shù)據(jù)分析和云端應(yīng)用;在 NVIDIA 平臺上進(jìn)行性能分析以及優(yōu)化,以充分發(fā)揮 NVIDIA GPU / CPU / DPU,集群和數(shù)據(jù)中心強(qiáng)大的算力,使其達(dá)到,或者接近“光速”(SOL)水平的高級技術(shù)團(tuán)隊。

該團(tuán)隊與世界上技術(shù)領(lǐng)先的企業(yè)、高校、研究院所合作,共同推動和加速各項 AI 應(yīng)用的落地。通過與用戶深度緊密的合作,在大語言模型、生成式 AI、推薦系統(tǒng)、自動駕駛、自然語言處理、視頻和圖像理解、語音識別與合成,游戲等領(lǐng)域取得了累累碩果。該團(tuán)隊成為幫助客戶發(fā)揮硬件平臺和軟件棧綜合算力的中堅力量,能夠為產(chǎn)品研發(fā)團(tuán)隊提供性能優(yōu)化、設(shè)計原型和行業(yè)應(yīng)用案例。

團(tuán)隊目標(biāo):在 NVIDIA 系統(tǒng)上,將各類應(yīng)用優(yōu)化到性能極致!

以打造大語言模型(LLM)應(yīng)用為例,既可以直接使用 NVAIE / NVIDIA Nemo Service,也可以使用應(yīng)用框架(Nemo FW、Triton+TensorRT、FT等)來訓(xùn)練和部署模型,也可以基于 cuDNN / TensorRT 等軟件庫自己開發(fā)自己的框架,還可以基于 CUDA 來完全定制化自己的 pipeline,或者也可以混合采用這些方法。

如何選擇一種合適的方法,其關(guān)鍵在于取得應(yīng)用場景、性能要求、平臺靈活性、時間成本、技術(shù)成本之間的平衡。NVIDIA 計算專家團(tuán)隊就是幫助客戶和 NVIDIA 解決這個問題的。

上下滑動查看更多詳情

團(tuán)隊發(fā)展

團(tuán)隊成員主要來自北京、上海、深圳、臺北、首爾等地。

科學(xué)計算時代,當(dāng)整個市場都還只關(guān)注于不斷擴(kuò)大通用硬件的規(guī)模時,NVIDIA 推出了加速計算 GPGPU 和 CUDA 編程模型。GPU 和 CUDA 這一全新的加速計算范式,為業(yè)界帶來了源源不斷的加速,但是也對應(yīng)用的開發(fā)和優(yōu)化提出了挑戰(zhàn)。

在不斷改進(jìn)基礎(chǔ)庫性能的同時,NVIDIA 組建了一支特別團(tuán)隊,關(guān)注更為具體的應(yīng)用。團(tuán)隊成員們不僅有深厚的計算機(jī)功底(從計算機(jī)體系結(jié)構(gòu)、CUDA 編程,到編譯原理、網(wǎng)絡(luò)互連),還擁有各個領(lǐng)域的專業(yè)知識。這支團(tuán)隊不但可以從 GPU 編程方面對程序進(jìn)行優(yōu)化,更能從算法、模型方面提出改進(jìn)建議,這使得 NVIDIA GPU 從科學(xué)計算領(lǐng)域脫穎而出。

隨著深度學(xué)習(xí)的高速發(fā)展,該團(tuán)隊也在續(xù)寫著相同的故事。對于 AI 中的神經(jīng)網(wǎng)絡(luò),從代碼和算法兩個方面對其進(jìn)行優(yōu)化。代碼方面涉及 CUDA、GPU 庫,多機(jī)多卡網(wǎng)絡(luò)互連等各個領(lǐng)域;而算法包括了模型壓縮、量化、剪枝、混合精度訓(xùn)練、梯度壓縮等,其最終目標(biāo)都是在模型精度沒有損失,或者損失不大的情況下,提高訓(xùn)練和預(yù)測的速度。

對于一個基于 AI 的實(shí)際工業(yè)項目,除了神經(jīng)網(wǎng)絡(luò)以外,系統(tǒng)內(nèi)還包括了很多其他模塊,神經(jīng)網(wǎng)絡(luò)在其中耗時只占 1/3 - 1/2。以互聯(lián)網(wǎng)核心的推薦系統(tǒng)為例,其包括了召回、過濾、粗排、精排、離線訓(xùn)練、在線訓(xùn)練、ETL、特征工程等模塊和流程。該團(tuán)隊致力于提供全流程的參考解決方案,讓盡可能多的模塊運(yùn)行在 GPU 上,進(jìn)而為應(yīng)用帶來顯著加速。

上下滑動查看更多詳情

點(diǎn)擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!


原文標(biāo)題:NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3723

    瀏覽量

    90712

原文標(biāo)題:NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA Omniverse加速零售數(shù)字化轉(zhuǎn)型

    大模型、生成式 AI、數(shù)字孿生技術(shù)等前沿科技啟發(fā)了各行各業(yè)的新業(yè)務(wù)模態(tài),在這時代背景下 NVIDIA 作為 AI 技術(shù)的耕耘者、加速計算方面的領(lǐng)導(dǎo)者,看到了數(shù)字化浪潮中前所未有的變革
    的頭像 發(fā)表于 11-09 13:52 ?177次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫,是支持復(fù)雜計算和流數(shù)據(jù)分析的實(shí)時
    的頭像 發(fā)表于 09-09 09:57 ?391次閱讀
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺提升<b class='flag-5'>計算</b>性能

    NVIDIA加速計算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計算和生成式
    的頭像 發(fā)表于 09-09 09:18 ?477次閱讀

    借助NVIDIA超級計算機(jī)加速量子計算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了項研究,通過使用 NVIDIA 驅(qū)動的超級計算機(jī),驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?477次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?652次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續(xù)的加速計算產(chǎn)品組合以及全生命周期服務(wù),將簡化 AI 創(chuàng)造價值的過程,加速生成式 AI 的發(fā)展步伐。 NVIDIA AI Computing by HPE 由
    的頭像 發(fā)表于 06-21 14:39 ?308次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創(chuàng)性的站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計算產(chǎn)品組合以及全生
    的頭像 發(fā)表于 06-20 17:36 ?664次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持

    和部署邊緣 AI 解決方案。 NVIDIA AI Enterprise-IGX 是款全新產(chǎn)品,其為企業(yè)的邊緣計算軟件堆棧提供前所未有的性能、安全性和支持,簡
    的頭像 發(fā)表于 06-04 10:21 ?450次閱讀

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    德國、日本和波蘭的超級計算機(jī)利用 Grace-Hopper 和量子-經(jīng)典加速超算平臺推進(jìn)量子計算研究 ? ? 德國漢堡 —— 國際超算大會(ISC)—— 2024 年 5 月 13 日
    發(fā)表于 05-13 15:21 ?180次閱讀
    <b class='flag-5'>NVIDIA</b> 通過 CUDA-Q 平臺為全球各地的量子<b class='flag-5'>計算</b>中心提供<b class='flag-5'>加速</b>

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    深度解讀Nvidia AI芯片路線圖

    Nvidia個同時擁有 GPU、CPU和DPU的計算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C技術(shù)將CPU、GPU進(jìn)行靈活連接組合形成統(tǒng)
    發(fā)表于 03-13 09:25 ?795次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI芯片路線圖

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計算巨頭的計算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?535次閱讀

    2024春季招聘,最熱門的崗位是……?鴻蒙

    。根據(jù)智聯(lián)招聘發(fā)布的《2024年春市場行情周報》顯示,就業(yè)市場回暖復(fù)蘇, 鴻蒙相關(guān)崗位成為招聘亮點(diǎn) 。 鴻蒙市場如火如荼 根據(jù)智聯(lián)招聘數(shù)據(jù)
    的頭像 發(fā)表于 02-28 22:07 ?537次閱讀
    2024春季<b class='flag-5'>招聘</b>,最熱門的<b class='flag-5'>崗位</b>是……?鴻蒙

    NVIDIA 初創(chuàng)加速計劃 Omniverse 加速

    的重要力量?;?NVIDIA 全棧式 AI 計算平臺和 Omniverse TM 平臺上的生成式 AI 創(chuàng)作實(shí)踐,讓企業(yè)、開發(fā)者能夠了解可落地的生成式 AI 內(nèi)容創(chuàng)作技術(shù)及其技術(shù)趨勢與當(dāng)前邊界。 NVIDIA 初創(chuàng)
    的頭像 發(fā)表于 12-04 20:35 ?607次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計劃 Omniverse <b class='flag-5'>加速</b>營

    NVIDIA再出手!加速開發(fā)邊緣AI應(yīng)用,迎接生成式AI新紀(jì)元

    NVIDIA 近日宣布,對適用于邊緣 AI 和機(jī)器人的 NVIDIA Jetson 平臺上的兩個框架進(jìn)行大規(guī)模擴(kuò)展。NVIDIA Isaac ROS 機(jī)器人框架已全面上市,NVIDIA
    的頭像 發(fā)表于 11-23 17:31 ?1029次閱讀
    <b class='flag-5'>NVIDIA</b>再出手!<b class='flag-5'>加速</b>開發(fā)邊緣AI應(yīng)用,<b class='flag-5'>迎接</b>生成式AI新紀(jì)元