0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

gpu加速原理

工程師 ? 來(lái)源:未知 ? 作者:姚遠(yuǎn)香 ? 2018-12-17 16:17 ? 次閱讀

GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過(guò)程中能夠發(fā)揮更大的效能。例如:當(dāng)前最頂級(jí)的CPU只有4核或者6核,模擬出8個(gè)或者12個(gè)處理線程來(lái)進(jìn)行運(yùn)算,但是普通級(jí)別的GPU就包含了成百上千個(gè)處理單元,高端的甚至更多,這對(duì)于多媒體計(jì)算中大量的重復(fù)處理過(guò)程有著天生的優(yōu)勢(shì)。下圖展示了CPU和GPU架構(gòu)的對(duì)比。

硬件設(shè)計(jì)上來(lái)講,CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成。另一方面,GPU 則由數(shù)以千計(jì)的更小、更高效的核心組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。

通過(guò)上圖我們可以較為容易地理解串行運(yùn)算和并行運(yùn)算之間的區(qū)別。傳統(tǒng)的串行編寫軟件具備以下幾個(gè)特點(diǎn):要運(yùn)行在一個(gè)單一的具有單一中央處理器(CPU)的計(jì)算機(jī)上;一個(gè)問(wèn)題分解成一系列離散的指令;指令必須一個(gè)接著一個(gè)執(zhí)行;只有一條指令可以在任何時(shí)刻執(zhí)行。而并行計(jì)算則改進(jìn)了很多重要細(xì)節(jié):要使用多個(gè)處理器運(yùn)行;一個(gè)問(wèn)題可以分解成可同時(shí)解決的離散指令;每個(gè)部分進(jìn)一步細(xì)分為一系列指示;每個(gè)部分的問(wèn)題可以同時(shí)在不同處理器上執(zhí)行。

舉個(gè)生活中的例子來(lái)說(shuō),你要點(diǎn)一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個(gè)人收到外賣的時(shí)間必然很長(zhǎng);而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點(diǎn)餐之后收貨就會(huì)比大貨車快很多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10702

    瀏覽量

    209403
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128153
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英偉達(dá)震撼發(fā)布:全新AI模型參數(shù)規(guī)模躍升至80億量級(jí)

    8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢(shì),適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)境。
    的頭像 發(fā)表于 08-23 16:08 ?548次閱讀

    摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案

    的方案與實(shí)踐,摩爾線程受邀參展。 此次展覽,摩爾線程展示了基于國(guó)產(chǎn)空間智能軟件技術(shù)SuperMap開發(fā)的最新成果——“摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案”。方案顯示,在國(guó)產(chǎn)GPU的算力支持下,SuperMap三維G
    的頭像 發(fā)表于 06-27 18:15 ?785次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺(jué)AI開發(fā)

    NVIDIA DeepStream 是一款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺(jué) AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?439次閱讀
    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺(jué)AI開發(fā)

    瀚博半導(dǎo)體參加中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì),智啟GPU加速行業(yè)解決方案

    4月28日至29日,2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)在蘇州召開。作為中國(guó)移動(dòng)合作伙伴,瀚博半導(dǎo)體受邀參與本次大會(huì)并全面展示瀚博產(chǎn)品家族及云電腦、云手機(jī)、云游戲、AI大模型場(chǎng)景下的最新技術(shù)與解決方案,與眾多產(chǎn)業(yè)生態(tài)合作伙伴共話前沿發(fā)展趨勢(shì)與算力未來(lái)。
    的頭像 發(fā)表于 04-30 14:32 ?1368次閱讀
    瀚博半導(dǎo)體參加中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì),智啟<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>行業(yè)解決方案

    搭載英偉達(dá)GPU,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù)

    基于GPU的向量索引和搜索加速能力,性能可提升 50 倍。 Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆。基準(zhǔn)測(cè)試顯示,與目前市面上最先進(jìn)的基于 CPU 處理器的索引技術(shù)
    的頭像 發(fā)表于 04-01 14:33 ?358次閱讀
    搭載英偉達(dá)<b class='flag-5'>GPU</b>,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù)

    什么是自動(dòng)語(yǔ)音識(shí)別(ASR)?如何使用深度學(xué)習(xí)和GPU加速ASR

    ASR 是自然語(yǔ)言中一項(xiàng)頗具挑戰(zhàn)性的任務(wù),它由語(yǔ)音分割、聲學(xué)建模和語(yǔ)言建模等一系列子任務(wù)組成,根據(jù)噪聲和未分割的輸入數(shù)據(jù)形成預(yù)測(cè)(標(biāo)簽序列)。
    發(fā)表于 02-28 15:01 ?3681次閱讀
    什么是自動(dòng)語(yǔ)音識(shí)別(ASR)?如何使用深度學(xué)習(xí)和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>ASR

    利用GPU加速在Orange Pi?5上跑LLMs:人工智能愛好者High翻了!

    本期視頻將會(huì)給人工智能愛好者們帶來(lái)超級(jí)震撼!視頻中,我們將深入了解利用GPU加速在OrangePi5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速,在OrangePi上跑
    的頭像 發(fā)表于 01-22 15:29 ?826次閱讀
    利用<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>在Orange Pi?5上跑LLMs:人工智能愛好者High翻了!

    GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢(shì)

    學(xué)習(xí)中究竟擔(dān)當(dāng)了什么樣的角色?又有哪些優(yōu)勢(shì)呢?一、GPU加速深度學(xué)習(xí)訓(xùn)練并行處理GPU的核心理念在于并行處理。在深度學(xué)習(xí)訓(xùn)練過(guò)程中,需要處理大量的數(shù)據(jù)。GPU通過(guò)
    的頭像 發(fā)表于 12-06 08:27 ?1091次閱讀
    <b class='flag-5'>GPU</b>在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢(shì)

    2023 AI芯片行業(yè)發(fā)展簡(jiǎn)析報(bào)告

    2022年加速服務(wù)器市場(chǎng)規(guī)模達(dá)到67億美元,同比增長(zhǎng)24%。其中GPU服務(wù)器依然是主導(dǎo)地位,占據(jù)89%的市場(chǎng)份額,達(dá)到60億美元。同時(shí)NPU、ASIC和FPGA等非GPU加速服務(wù)器以同
    的頭像 發(fā)表于 11-23 15:56 ?834次閱讀
    2023 AI芯片行業(yè)發(fā)展簡(jiǎn)析報(bào)告

    GPU 加速油氣勘探,打造新一代地震數(shù)據(jù)分析平臺(tái)

    國(guó)內(nèi)一家從事油氣勘探的領(lǐng)先企業(yè)承接了大量的國(guó)內(nèi)外石油天然氣勘探項(xiàng)目,每年的地震數(shù)據(jù)分析處理的任務(wù)量非常大,傳統(tǒng)的 HPC 計(jì)算方法無(wú)法大幅提升數(shù)據(jù)處理效率。 在傳統(tǒng)的地震數(shù)據(jù)處理和解釋過(guò)程中,有一些操作需要人工來(lái)完成,或使用傳統(tǒng)的特征提取的方法,如去噪、初至拾取、速度拾取、斷層檢測(cè)、地質(zhì)體識(shí)別等。傳統(tǒng)方法不僅工作效率低下,而且對(duì)專業(yè)經(jīng)驗(yàn)要求非常高,成為提高地震處理和解釋效率的瓶頸。 傳統(tǒng) HPC 計(jì)算方法 無(wú)法大幅提
    的頭像 發(fā)表于 11-20 21:00 ?457次閱讀

    開發(fā)者活動(dòng) | 即刻報(bào)名 AI for Science GPU Hackathon 2023

    數(shù)天的云計(jì)算和科學(xué)實(shí)踐項(xiàng)目,旨在幫助科研領(lǐng)域研究人員在各種云上數(shù)據(jù)中心架構(gòu)(包括 CPU 和 GPU)下移植、加速和優(yōu)化其研究項(xiàng)目和應(yīng)用程序。 大賽主辦方將安排專業(yè)的云計(jì)算和 GPU 加速
    的頭像 發(fā)表于 11-09 19:25 ?357次閱讀
    開發(fā)者活動(dòng) | 即刻報(bào)名 AI for Science <b class='flag-5'>GPU</b> Hackathon 2023

    177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

    但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個(gè)使用GPU加速SDF建圖的庫(kù)。計(jì)算速度非??欤噍^CPU計(jì)算TSDF甚至快了177倍。更重要的是,因?yàn)樗袛?shù)據(jù)都已經(jīng)存儲(chǔ)在GPU上,所以很容易和深度學(xué)習(xí)方案結(jié)合!
    的頭像 發(fā)表于 11-09 16:46 ?916次閱讀
    177倍<b class='flag-5'>加速</b>!NVIDIA最新開源 | <b class='flag-5'>GPU</b><b class='flag-5'>加速</b>各種SDF建圖!

    NVIDIA 攜手 NTT DOCOMO 推出全球首個(gè) GPU 加速的 5G 網(wǎng)絡(luò)

    高性能、軟件定義的無(wú)線網(wǎng)絡(luò)正在日本落地應(yīng)用。 生成式 AI 席卷全球,成為全球企業(yè)熱議的話題。在此趨勢(shì)下,全球各地的電信公司也在探索如何通過(guò) 5G 和即將到來(lái)的 6G 網(wǎng)絡(luò),以更具成本效益的方式,將新的 AI 應(yīng)用交付到邊緣。 電信公司計(jì)劃到 2025 年在全球部署超過(guò) 1700 萬(wàn)個(gè) 5G 微基站和信號(hào)塔。建設(shè)、管理并優(yōu)化這些新的基礎(chǔ)設(shè)施,同時(shí)保持交付的服務(wù)質(zhì)量并最大限度地提升客戶體驗(yàn),已成為電信行業(yè)日后面臨的巨大挑戰(zhàn)。 9 月 27 日,NTT DOCOMO 宣布
    的頭像 發(fā)表于 09-28 18:25 ?352次閱讀
    NVIDIA 攜手 NTT DOCOMO 推出全球首個(gè) <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>的 5G 網(wǎng)絡(luò)

    NVIDIA與NTT DOCOMO聯(lián)手打造全球首個(gè)GPU加速5G網(wǎng)絡(luò),歐盟要求蘋果開放生態(tài)

    大家好,歡迎收看河套IT WALK第113期。 NVIDIA與NTT DOCOMO合作推出了全球首個(gè)GPU加速的5G網(wǎng)絡(luò),這一突破性技術(shù)將改變我們對(duì)5G網(wǎng)絡(luò)的認(rèn)知和使用方式。歐盟對(duì)蘋果提出了一個(gè)靈魂
    的頭像 發(fā)表于 09-27 21:20 ?621次閱讀
    NVIDIA與NTT DOCOMO聯(lián)手打造全球首個(gè)<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>5G網(wǎng)絡(luò),歐盟要求蘋果開放生態(tài)

    Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

    生成式 AI 和大語(yǔ)言模型(LLM)不斷推動(dòng)突破性創(chuàng)新,訓(xùn)練和推理對(duì)算力的需求也隨之急劇上升。 這些現(xiàn)代生成式 AI 應(yīng)用需要全棧加速計(jì)算,首先要有能夠快速、準(zhǔn)確處理大量工作負(fù)載的先進(jìn)基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 09-25 20:40 ?470次閱讀
    Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>計(jì)算實(shí)例