0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于CFD領(lǐng)域的GPU加速設(shè)計(jì)解決方案

電子設(shè)計(jì) ? 來源:e-works ? 作者:e-works ? 2021-03-27 12:18 ? 次閱讀

由于仿真軟件需要耗費(fèi)大量計(jì)算資源,許多計(jì)算機(jī)輔助工程 (CAE) 應(yīng)用都可以從 GPU 的并行處理能力中大受裨益。與 CPU 相比,GPU 的密度更高而總體擁有成本更低,因此具有明顯的性價(jià)比優(yōu)勢(shì),今天為大家分享基于CFD領(lǐng)域的GPU加速體驗(yàn)。

計(jì)算流體仿真力學(xué),英文全稱Computational Fluid Dynamics,縮寫為CFD,它是數(shù)值數(shù)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合的產(chǎn)物,通過空間離散和數(shù)值求解的思路,對(duì)流體力學(xué)的各類問題進(jìn)行數(shù)值實(shí)驗(yàn)、模擬和分析研究,以解決學(xué)習(xí)、科研或者工程設(shè)計(jì)中的問題。

面對(duì)一個(gè)具體的工程問題,CFD工程師在應(yīng)用CFD工具進(jìn)行仿真分析時(shí)的基本流程,通??梢钥偨Y(jié)為五步:前處理、網(wǎng)格劃分、邊界條件加載、求解計(jì)算和后處理。但如何去平衡計(jì)算量(網(wǎng)格數(shù)量)和計(jì)算時(shí)間,對(duì)于很多CFD工程師都是個(gè)挑戰(zhàn)。

在實(shí)際解決問題的過程中,CFD工程師除了希望能選擇一款稱手的軟件工具外,當(dāng)然也希望計(jì)算機(jī)的主頻越高越好,核心越多越好。但是,核心與計(jì)算速度并非線性關(guān)系,不會(huì)因?yàn)楹诵牡缺壤鲩L(zhǎng)。若想在單臺(tái)電腦上發(fā)揮極限運(yùn)算能力,還需要使用GPU加速,因?yàn)镚PU加速通過協(xié)調(diào)處理器并行運(yùn)算,能夠極大地提升計(jì)算能力,尤其適合多個(gè)項(xiàng)目同時(shí)進(jìn)行,這樣獲得的時(shí)間收益較大。

流體仿真為什么要選擇GPU?

CFD始終向處理更高精確度、更復(fù)雜的幾何結(jié)構(gòu)方向發(fā)展。但現(xiàn)階段,CFD軟件應(yīng)用于復(fù)雜流體問題方面還有待拓展,受到的阻礙主要源自以下三個(gè)方面:

● 隱式算法的高內(nèi)存要求——一些CFD分析工程師總是希望得到完美的殘差收斂曲線,以證明計(jì)算結(jié)果的可靠性,因此,他們會(huì)首選隱式算法,這意味著高內(nèi)存的需求;

● CFD結(jié)果對(duì)網(wǎng)格的強(qiáng)依賴性——網(wǎng)格的合理設(shè)計(jì)和高質(zhì)量生成是CFD計(jì)算的前提條件,是影響CFD計(jì)算結(jié)果的最主要的決定性因素之一,是CFD工作中人工工作量最大的部分,也是制約CFD工作效率的瓶頸問題之一。即使在CFD高度發(fā)達(dá)的國(guó)家,網(wǎng)格生成仍占整個(gè)CFD計(jì)算任務(wù)全部人力時(shí)間的70%~80%。

● 工程流體仿真問題復(fù)雜多變——在流體力學(xué)模擬中,由于流體力學(xué)模擬是個(gè)復(fù)雜的過程,存在極端變形、自由液面以及物質(zhì)運(yùn)動(dòng)交界面等問題,在應(yīng)用網(wǎng)格數(shù)值模擬時(shí),會(huì)出現(xiàn)網(wǎng)格扭曲導(dǎo)致計(jì)算不收斂或者產(chǎn)生很大的計(jì)算誤差,需要重新模擬,這使得計(jì)算成本大大增加。

為了使CFD仿真發(fā)揮最大效用,CFD工程師往往需要快速得到計(jì)算結(jié)果。而借助于GPU加速計(jì)算所提供的非凡應(yīng)用程序性能,能將CFD程序計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時(shí)仍有CPU運(yùn)行其余程序代碼,這樣計(jì)算速度大大提升。另外,從計(jì)算性能來看,在CFD應(yīng)用中單個(gè)GPU的性能遠(yuǎn)遠(yuǎn)優(yōu)于CPU,基于GPU加速的CFD計(jì)算速度明顯加快,很多復(fù)雜的CFD難題得以解決,因此,越來越多的CFD工程師選擇GPU加速。

流體仿真分析GPU評(píng)測(cè)

CFD是一個(gè)計(jì)算需求強(qiáng)烈的領(lǐng)域,GPU的選擇將從根本上決定CFD分析過程的體驗(yàn)。在CFD分析中,工程師前期花費(fèi)的時(shí)間主要在模型建立和修改上,后期真正的分析時(shí)間消耗在計(jì)算機(jī)上,因此,選擇一款適合自身的CFD軟件和高性能建模工作站就顯得尤為重要。接下來分享來自e-works平臺(tái)基于Altair CFD應(yīng)用軟件以及一些案例模型的實(shí)際評(píng)測(cè),供大家參考:

基于Altair AcuSolve軟件的 GPU加速

【軟件環(huán)境介紹】Altair AcuSolve是一款基于GLS-FEM算法的通用熱流體求解器,不但有快速良好的收斂速度,還能達(dá)到很高的求解精度,同時(shí)對(duì)網(wǎng)格有良好的兼容性,特別方便于復(fù)雜模型網(wǎng)格的劃分,廣泛應(yīng)用于汽車、流體機(jī)械和海洋平臺(tái)等工業(yè)和科學(xué)應(yīng)用問題的解決。值得一提的是,最新版本的AcuSolve,不僅通過GPU加速提高了3~4倍的計(jì)算速度,同時(shí)也支持核態(tài)沸騰、熱輻射、冷凝/蒸發(fā)多相流和流固耦合(FSI)等CFD難題的解決。

硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000,它采用了NVIDIA Turing架構(gòu)和NVIDIA RTX平臺(tái)支持,對(duì)于追求以高穩(wěn)健性、高精度為目標(biāo)的CFD仿真分析帶來了卓越的計(jì)算性能體驗(yàn)。

【測(cè)試模型】在新能源汽車、醫(yī)療設(shè)備、軍工設(shè)備等大功率密度的應(yīng)用場(chǎng)合,設(shè)備運(yùn)行時(shí)會(huì)產(chǎn)生大量的熱損耗,為保證設(shè)備的安全運(yùn)行,需要采用各種冷卻措施來對(duì)設(shè)備進(jìn)行冷卻,水冷是其中一種方式。以新能源車的水冷板為例,其設(shè)計(jì)直接影電池的溫度均勻性,進(jìn)而影響車輛的續(xù)航里程和安全性。本測(cè)試模型擁有網(wǎng)格數(shù)量4300萬(wàn),求解方程采用湍流+固體傳熱組合,湍流模型選擇基于SA一方程的模型,設(shè)置穩(wěn)態(tài)迭代步為200步,分別采用無GPU和1塊GPU加速進(jìn)行計(jì)算時(shí)間對(duì)比。

動(dòng)力電池水冷板模型

計(jì)算時(shí)間對(duì)比

【測(cè)試結(jié)果】數(shù)據(jù)表明,無GPU加速時(shí),水冷板分析的計(jì)算時(shí)間需要21小時(shí);采用單塊Quadro RTX 8000加速,水冷板分析的計(jì)算時(shí)間只需要4小時(shí)。由此可見,采用Altair AcuSolve進(jìn)行水冷板仿真分析,并提供RTX GPU的增強(qiáng)支持,計(jì)算速度與無GPU加速相比提高了4.25倍。顯然,這種方式對(duì)于CFD工程師快速探索水冷板的設(shè)計(jì),并根據(jù)準(zhǔn)確的計(jì)算結(jié)果做出決策非常有益。

基于Altair nanoFluidX軟件的 GPU加速

【軟件環(huán)境介紹】Altair nanoFluidX是一款基于粒子的流體動(dòng)力學(xué) (SPH) 仿真工具,用于預(yù)測(cè)運(yùn)動(dòng)軌跡復(fù)雜的幾何結(jié)構(gòu)周圍的流體。以整車CFD仿真為例,傳統(tǒng)CFD方法需要建立網(wǎng)格耗時(shí)巨大,但Altair nanoFluidX基于粒子的特性,無需建立網(wǎng)格,還可基于GPU顯卡計(jì)算,非常有助于工程師獲得簡(jiǎn)潔而高效的CFD解決方案。

【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其計(jì)算是由一系列的流體粒子的相互作用完成,在計(jì)算中每個(gè)粒子所執(zhí)行的計(jì)算是完全相同的,而在不同的數(shù)據(jù)上執(zhí)行相同的程序,恰恰是GPU計(jì)算最擅長(zhǎng)的。

【測(cè)試模型】整車涉水分析是近年來新興的CFD仿真領(lǐng)域,主要研究汽車以一定速度涉水時(shí),關(guān)鍵零部件的進(jìn)水風(fēng)險(xiǎn),如防火墻滲水,傳統(tǒng)的發(fā)動(dòng)機(jī)進(jìn)氣口進(jìn)水,電動(dòng)汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計(jì)算資源和時(shí)間進(jìn)行求解,以本次建立的整車涉水模型為例,擁有粒子數(shù)量為4100萬(wàn),設(shè)置車速為50公里/小時(shí)、瞬態(tài)物理時(shí)間為4秒,建立單相流模型,本次測(cè)試分別采用1塊RTX 8000 、2塊RTX 8000、4塊RTX 8000和4塊Tesla V100加速,對(duì)比計(jì)算時(shí)間。

整車涉水模型

計(jì)算時(shí)間對(duì)比

【測(cè)試結(jié)果】數(shù)據(jù)表明,采用1塊、2塊、4塊RTX 8000加速,整車涉水分析分別需要花費(fèi)48小時(shí)、28小時(shí)、13小時(shí);采用4塊V100,則需要16個(gè)小時(shí)。從計(jì)算時(shí)間來看,采用4塊RTX 8000加速,計(jì)算時(shí)間最少,與采用1塊RTX 8000加速相比,計(jì)算速度提升了約2.7倍。計(jì)算結(jié)果也表明,采用基于GPU加速和Altair nanoFluidX的組合方式,允許CFD工程師在一個(gè)更可接受的短時(shí)間內(nèi)研究類似整車涉水這樣的復(fù)雜流體問題。

基于Altair ultraFluidX軟件的 GPU加速

【軟件環(huán)境介紹】Altair ultraFluidX專用于超快預(yù)測(cè)乘用車、輕型卡車、賽車和重型車輛的空氣動(dòng)力特性的仿真分析,它基于格子玻爾茲曼(LBM)技術(shù),無需建立網(wǎng)格,這大大縮短了建模時(shí)間,使得設(shè)計(jì)變得更加容易,同時(shí)保留了所有重要的幾何細(xì)節(jié)。

【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常適合大規(guī)模并行架構(gòu),而采用GPU加速,可以明顯提高吞吐量,達(dá)到Altair ultraFluidX的周轉(zhuǎn)時(shí)間,同時(shí)降低硬件和能源成本。

【測(cè)試模型】對(duì)于車輛的早期開發(fā)優(yōu)化,采用CFD手段無疑是最有效且最經(jīng)濟(jì)的方法,但這類CFD分析往往是高內(nèi)存和高計(jì)算資源消耗的典型代表,需要使用GPU來優(yōu)化計(jì)算性能。以此次建立的汽車虛擬風(fēng)洞模型為例,擁有格子數(shù)量1億6千萬(wàn),格子的最小尺寸為1.8mm,設(shè)置車速為140公里/小時(shí)、瞬態(tài)物理時(shí)間為2秒,分別采用2塊NVIDIA RTX 8000、4塊NVIDIA RTX 8000和4塊V100加速,對(duì)比計(jì)算時(shí)間。

汽車虛擬風(fēng)洞模型

計(jì)算時(shí)間對(duì)比

【測(cè)試結(jié)果】數(shù)據(jù)表明,采用2塊、4塊NVIDIA RTX8000加速,模擬汽車虛擬風(fēng)洞分別需要花費(fèi)14小時(shí)、8小時(shí);采用4塊V100,則需要8.4個(gè)小時(shí)。三種GPU加速中,采用4塊NVIDIA RTX8000加速,計(jì)算時(shí)間最少,與采用2塊NVIDIA RTX8000加速相比,計(jì)算速度提升了約0.75倍。計(jì)算結(jié)果也表明,基于GPU和Altair ultraFluidX的組合方式,可以明顯加速汽車虛擬風(fēng)洞分析,有效縮短汽車開發(fā)周期。

總結(jié)

作為當(dāng)前最重要的三大協(xié)處理加速技術(shù)之一,GPU已經(jīng)成為數(shù)值分析的新寵,廣泛應(yīng)用于各個(gè)領(lǐng)域。以流體仿真領(lǐng)域?yàn)槔?,隨著CFD分析對(duì)計(jì)算能力的要求日益增高,越來越多的CFD工程師傾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以遠(yuǎn)低于傳統(tǒng) CPU 解決方案的成本、空間和功耗,獲得無與倫比的計(jì)算性能。

同時(shí),在渲染方面,利用RTX 8000強(qiáng)大的運(yùn)算能力,將流場(chǎng)和流體構(gòu)件建立數(shù)學(xué)模型,并用數(shù)字化可視化的形式表現(xiàn)出來,可以獲得任意位置的結(jié)果值,這無疑也極大地提高了設(shè)計(jì)的精確性。e-works認(rèn)為,優(yōu)秀的計(jì)算性能和尖端的數(shù)值方法的組合,在更短的時(shí)間內(nèi)研究復(fù)雜的流體問題,將成為未來CFD領(lǐng)域高效而主流的方式。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • CFD
    CFD
    +關(guān)注

    關(guān)注

    1

    文章

    98

    瀏覽量

    18233
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    268.英偉達(dá)顯卡GPU占用0%,CPU占用100%3D游戲卡頓解決方案NVIDIA設(shè)置

    NVIDIAgpu顯卡解決方案英偉達(dá)
    小凡
    發(fā)布于 :2022年10月04日 15:16:33

    立體智慧倉(cāng)儲(chǔ)解決方案.#云計(jì)算

    解決方案智能設(shè)備
    學(xué)習(xí)電子知識(shí)
    發(fā)布于 :2022年10月06日 19:45:47

    FPGA應(yīng)用領(lǐng)域解決方案

    FPGA應(yīng)用領(lǐng)域解決方案
    發(fā)表于 08-20 11:23

    FPGA典型應(yīng)用領(lǐng)域以及解決方案

    FPGA典型應(yīng)用領(lǐng)域以及解決方案
    發(fā)表于 08-20 13:36

    解決方案加速海嘯模擬

    挑戰(zhàn)海嘯模擬將物理過程模擬與大量深海數(shù)據(jù)相結(jié)合。這些計(jì)算通常在大規(guī)模并行超級(jí)計(jì)算機(jī)上完成,但具有硬件利用率低和性能差的缺陷。解決方案通過硬件浮點(diǎn) FPGA 加速模擬內(nèi)循環(huán)可實(shí)現(xiàn)高達(dá) 383
    發(fā)表于 07-27 15:04

    GPU加速XenApp/Windows 2016/Office/IE性能會(huì)提高嗎

    大家好,我目前正在為使用XenServer 7.2和NVIDIA M10卡的客戶開發(fā)新的XenApp 7.14.1解決方案。在目前階段,我試圖通過分配給每個(gè)XenApp服務(wù)器的M10-8A vGPU
    發(fā)表于 09-12 16:24

    GPU加速matlab程序

    最近遇到了一個(gè)加速matlab程序的問題,不知道如何利用GPU,以及使用GPU的先決條件,是不是GPU加速必須要用cuda,最重要的是只用G
    發(fā)表于 03-30 11:21

    機(jī)器學(xué)習(xí)實(shí)戰(zhàn):GNN加速器的FPGA解決方案

    ,其算法的軟件實(shí)現(xiàn)方式非常低效,所以業(yè)界對(duì)GNN的硬件加速有著非常迫切的需求。我們知道傳統(tǒng)的CNN(卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò))硬件加速方案已經(jīng)有非常多的解決方案;但是,GNN的硬件
    發(fā)表于 10-20 09:48

    tengine是如何使用arm的GPU進(jìn)行加速

    【嵌入式AI】多目標(biāo)分類檢測(cè)系統(tǒng)實(shí)戰(zhàn)中,tengine是如何使用arm的GPU進(jìn)行加速的,這個(gè)原理能詳細(xì)說明一下嗎?
    發(fā)表于 09-02 14:18

    NVIDIA GPU解決方案亮相 推進(jìn)專業(yè)視聽產(chǎn)業(yè)升級(jí)

    亞太專業(yè)視聽和交互體驗(yàn)式通信技術(shù)交流的平臺(tái)會(huì)議InfoComm China 2019在北京啟幕,作為全球視覺計(jì)算技術(shù)的行業(yè)領(lǐng)袖,NVIDIA攜專業(yè)視覺解決方案Quadro RTX GPU和虛擬GPU
    發(fā)表于 07-19 10:58 ?649次閱讀

    AMD嵌入式GPU為醫(yī)療成像領(lǐng)域提供解決方案

    AMD (NASDAQ: AMD)今日宣布AMD嵌入式Radeon? HD 7850 GPU已經(jīng)開始為Analogic公司旗下的BK Ultrasound bk3000?超聲系統(tǒng)提供前沿的卓越應(yīng)用性能。Analogic是醫(yī)療和安全技術(shù)解決方案研發(fā)
    發(fā)表于 07-23 14:15 ?1156次閱讀

    FPGA與GPU計(jì)算存儲(chǔ)加速對(duì)比

    為了提升計(jì)算基礎(chǔ)設(shè)施的性能,并緊跟數(shù)據(jù)分析與 AI 不斷攀升的需求,眾多企業(yè)將硬件加速視為主要的解決方案。在大多數(shù)情況下,先進(jìn)的可編程硬件(主要是指 GPU 和 FPGA)是加速的主要
    的頭像 發(fā)表于 08-02 08:03 ?2140次閱讀
    FPGA與<b class='flag-5'>GPU</b>計(jì)算存儲(chǔ)<b class='flag-5'>加速</b>對(duì)比

    采用賽靈思Alveo的CFD內(nèi)核加速

    電子發(fā)燒友網(wǎng)站提供《采用賽靈思Alveo的CFD內(nèi)核加速.pdf》資料免費(fèi)下載
    發(fā)表于 09-13 10:39 ?0次下載
    采用賽靈思Alveo的<b class='flag-5'>CFD</b>內(nèi)核<b class='flag-5'>加速</b>

    直播就在明天!Cadence Fidelity 水泵水輪機(jī) CFD 模擬解決方案和應(yīng)用

    Fidelity 為工具,圍繞“全自動(dòng)化結(jié)構(gòu)網(wǎng)格劃分”、“計(jì)算魯棒性”、“氣蝕”以及“性能優(yōu)化”等為主題展開討論水泵水輪機(jī) CFD 模擬解決方案和應(yīng)用。 直播時(shí)間 2023 年 11 月 22 日(周三)19:30 在線報(bào)名 點(diǎn)擊下方小程序報(bào)名 關(guān)于 Cadence C
    的頭像 發(fā)表于 11-21 15:50 ?455次閱讀
    直播就在明天!Cadence Fidelity 水泵水輪機(jī) <b class='flag-5'>CFD</b> 模擬<b class='flag-5'>解決方案</b>和應(yīng)用

    全新Ansys Fluent Web用戶界面支持訪問大規(guī)模多GPU CFD仿真

    基于Web的技術(shù)將釋放云計(jì)算的強(qiáng)大功能,加速CFD仿真,從而減少對(duì)硬件資源的依賴
    的頭像 發(fā)表于 02-25 09:59 ?477次閱讀