GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過(guò)程中能夠發(fā)揮更大的效能。例如:當(dāng)前最頂級(jí)的CPU只有4核或者6核,模擬出8個(gè)或者12個(gè)處理線程來(lái)進(jìn)行運(yùn)算,但是普通級(jí)別的GPU就包含了成百上千個(gè)處理單元,高端的甚至更多,這對(duì)于多媒體計(jì)算中大量的重復(fù)處理過(guò)程有著天生的優(yōu)勢(shì)。下圖展示了CPU和GPU架構(gòu)的對(duì)比。
從硬件設(shè)計(jì)上來(lái)講,CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成。另一方面,GPU 則由數(shù)以千計(jì)的更小、更高效的核心組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。
通過(guò)上圖我們可以較為容易地理解串行運(yùn)算和并行運(yùn)算之間的區(qū)別。傳統(tǒng)的串行編寫軟件具備以下幾個(gè)特點(diǎn):要運(yùn)行在一個(gè)單一的具有單一中央處理器(CPU)的計(jì)算機(jī)上;一個(gè)問(wèn)題分解成一系列離散的指令;指令必須一個(gè)接著一個(gè)執(zhí)行;只有一條指令可以在任何時(shí)刻執(zhí)行。而并行計(jì)算則改進(jìn)了很多重要細(xì)節(jié):要使用多個(gè)處理器運(yùn)行;一個(gè)問(wèn)題可以分解成可同時(shí)解決的離散指令;每個(gè)部分進(jìn)一步細(xì)分為一系列指示;每個(gè)部分的問(wèn)題可以同時(shí)在不同處理器上執(zhí)行。
舉個(gè)生活中的例子來(lái)說(shuō),你要點(diǎn)一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個(gè)人收到外賣的時(shí)間必然很長(zhǎng);而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點(diǎn)餐之后收貨就會(huì)比大貨車快很多。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢(shì),適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)境。
發(fā)表于 08-23 16:08
?548次閱讀
的方案與實(shí)踐,摩爾線程受邀參展。 此次展覽,摩爾線程展示了基于國(guó)產(chǎn)空間智能軟件技術(shù)SuperMap開發(fā)的最新成果——“摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案”。方案顯示,在國(guó)產(chǎn)GPU的算力支持下,SuperMap三維G
發(fā)表于 06-27 18:15
?785次閱讀
NVIDIA DeepStream 是一款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺(jué) AI 管線的 GPU 加速構(gòu)建模塊。
發(fā)表于 05-23 10:09
?439次閱讀
4月28日至29日,2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)在蘇州召開。作為中國(guó)移動(dòng)合作伙伴,瀚博半導(dǎo)體受邀參與本次大會(huì)并全面展示瀚博產(chǎn)品家族及云電腦、云手機(jī)、云游戲、AI大模型場(chǎng)景下的最新技術(shù)與解決方案,與眾多產(chǎn)業(yè)生態(tài)合作伙伴共話前沿發(fā)展趨勢(shì)與算力未來(lái)。
發(fā)表于 04-30 14:32
?1368次閱讀
基于GPU的向量索引和搜索加速能力,性能可提升 50 倍。 Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆。基準(zhǔn)測(cè)試顯示,與目前市面上最先進(jìn)的基于 CPU 處理器的索引技術(shù)
發(fā)表于 04-01 14:33
?358次閱讀
ASR 是自然語(yǔ)言中一項(xiàng)頗具挑戰(zhàn)性的任務(wù),它由語(yǔ)音分割、聲學(xué)建模和語(yǔ)言建模等一系列子任務(wù)組成,根據(jù)噪聲和未分割的輸入數(shù)據(jù)形成預(yù)測(cè)(標(biāo)簽序列)。
發(fā)表于 02-28 15:01
?3681次閱讀
本期視頻將會(huì)給人工智能愛好者們帶來(lái)超級(jí)震撼!視頻中,我們將深入了解利用GPU加速在OrangePi5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速,在OrangePi上跑
發(fā)表于 01-22 15:29
?826次閱讀
學(xué)習(xí)中究竟擔(dān)當(dāng)了什么樣的角色?又有哪些優(yōu)勢(shì)呢?一、GPU加速深度學(xué)習(xí)訓(xùn)練并行處理GPU的核心理念在于并行處理。在深度學(xué)習(xí)訓(xùn)練過(guò)程中,需要處理大量的數(shù)據(jù)。GPU通過(guò)
發(fā)表于 12-06 08:27
?1091次閱讀
2022年加速服務(wù)器市場(chǎng)規(guī)模達(dá)到67億美元,同比增長(zhǎng)24%。其中GPU服務(wù)器依然是主導(dǎo)地位,占據(jù)89%的市場(chǎng)份額,達(dá)到60億美元。同時(shí)NPU、ASIC和FPGA等非GPU加速服務(wù)器以同
發(fā)表于 11-23 15:56
?834次閱讀
國(guó)內(nèi)一家從事油氣勘探的領(lǐng)先企業(yè)承接了大量的國(guó)內(nèi)外石油天然氣勘探項(xiàng)目,每年的地震數(shù)據(jù)分析處理的任務(wù)量非常大,傳統(tǒng)的 HPC 計(jì)算方法無(wú)法大幅提升數(shù)據(jù)處理效率。 在傳統(tǒng)的地震數(shù)據(jù)處理和解釋過(guò)程中,有一些操作需要人工來(lái)完成,或使用傳統(tǒng)的特征提取的方法,如去噪、初至拾取、速度拾取、斷層檢測(cè)、地質(zhì)體識(shí)別等。傳統(tǒng)方法不僅工作效率低下,而且對(duì)專業(yè)經(jīng)驗(yàn)要求非常高,成為提高地震處理和解釋效率的瓶頸。 傳統(tǒng) HPC 計(jì)算方法 無(wú)法大幅提
發(fā)表于 11-20 21:00
?457次閱讀
數(shù)天的云計(jì)算和科學(xué)實(shí)踐項(xiàng)目,旨在幫助科研領(lǐng)域研究人員在各種云上數(shù)據(jù)中心架構(gòu)(包括 CPU 和 GPU)下移植、加速和優(yōu)化其研究項(xiàng)目和應(yīng)用程序。 大賽主辦方將安排專業(yè)的云計(jì)算和 GPU 加速
發(fā)表于 11-09 19:25
?357次閱讀
但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個(gè)使用GPU加速SDF建圖的庫(kù)。計(jì)算速度非??欤噍^CPU計(jì)算TSDF甚至快了177倍。更重要的是,因?yàn)樗袛?shù)據(jù)都已經(jīng)存儲(chǔ)在GPU上,所以很容易和深度學(xué)習(xí)方案結(jié)合!
發(fā)表于 11-09 16:46
?916次閱讀
高性能、軟件定義的無(wú)線網(wǎng)絡(luò)正在日本落地應(yīng)用。 生成式 AI 席卷全球,成為全球企業(yè)熱議的話題。在此趨勢(shì)下,全球各地的電信公司也在探索如何通過(guò) 5G 和即將到來(lái)的 6G 網(wǎng)絡(luò),以更具成本效益的方式,將新的 AI 應(yīng)用交付到邊緣。 電信公司計(jì)劃到 2025 年在全球部署超過(guò) 1700 萬(wàn)個(gè) 5G 微基站和信號(hào)塔。建設(shè)、管理并優(yōu)化這些新的基礎(chǔ)設(shè)施,同時(shí)保持交付的服務(wù)質(zhì)量并最大限度地提升客戶體驗(yàn),已成為電信行業(yè)日后面臨的巨大挑戰(zhàn)。 9 月 27 日,NTT DOCOMO 宣布
發(fā)表于 09-28 18:25
?352次閱讀
大家好,歡迎收看河套IT WALK第113期。 NVIDIA與NTT DOCOMO合作推出了全球首個(gè)GPU加速的5G網(wǎng)絡(luò),這一突破性技術(shù)將改變我們對(duì)5G網(wǎng)絡(luò)的認(rèn)知和使用方式。歐盟對(duì)蘋果提出了一個(gè)靈魂
發(fā)表于 09-27 21:20
?621次閱讀
生成式 AI 和大語(yǔ)言模型(LLM)不斷推動(dòng)突破性創(chuàng)新,訓(xùn)練和推理對(duì)算力的需求也隨之急劇上升。 這些現(xiàn)代生成式 AI 應(yīng)用需要全棧加速計(jì)算,首先要有能夠快速、準(zhǔn)確處理大量工作負(fù)載的先進(jìn)基礎(chǔ)設(shè)施
發(fā)表于 09-25 20:40
?470次閱讀
評(píng)論