一区二区三区免费高清视频,久久久久久精品色费色,人人妻人人澡人人爽人人精品电影

華東師范大學(xué)河口海岸學(xué)國家重點(diǎn)實(shí)驗(yàn)室葛建忠教授團(tuán)隊(duì)作為國際先進(jìn)海洋數(shù)值模型 FVCOM 開發(fā)團(tuán)隊(duì)核心成員，隨著 FVCOM 的發(fā)展和應(yīng)用越來越廣泛，以及行業(yè)不斷提升的對預(yù)報(bào)精度與時(shí)效性要求，算力需求劇增，借助 NVIDIA GPU 加速計(jì)算技術(shù)，不僅實(shí)現(xiàn)了傳統(tǒng)動(dòng)力學(xué)數(shù)值模型的百倍計(jì)算加速，造福了海洋預(yù)報(bào)、水利工程等具體應(yīng)用領(lǐng)域，也為海洋模型系統(tǒng)向人工智能模型轉(zhuǎn)型以及人工智能海洋學(xué)的發(fā)展提供了關(guān)鍵的基礎(chǔ)數(shù)據(jù)生成工具和方法，是人工智能技術(shù)進(jìn)一步應(yīng)用于海洋領(lǐng)域的重要基石。

海洋預(yù)報(bào)數(shù)值模型計(jì)算負(fù)載劇增

隨著自然災(zāi)害越來越頻發(fā)，為災(zāi)害過程防御提供技術(shù)支撐的數(shù)值預(yù)報(bào)系統(tǒng)對“精確、及時(shí)、高效、穩(wěn)定”有著越來越高的需求，特別是隨著集合預(yù)報(bào)模型的研發(fā)和應(yīng)用帶來了數(shù)值模型計(jì)算量的急劇上升（比如在集合預(yù)報(bào)中計(jì)算量與集合樣本數(shù)量成正比，是單個(gè)模型計(jì)算的數(shù)十倍），超大的計(jì)算負(fù)載給預(yù)報(bào)業(yè)務(wù)單位和超算中心帶來了極大的壓力，而預(yù)報(bào)系統(tǒng)又具有“高時(shí)效”的特點(diǎn)，要盡可能地控制計(jì)算量，從而提高預(yù)報(bào)時(shí)效。與此同時(shí)，河口生態(tài)、生物地球化學(xué)過程模型具有變量多、過程復(fù)雜的特點(diǎn)，其計(jì)算量一般是動(dòng)力模型的 10 倍以上。潮灘濕地植被斑塊及潮溝系統(tǒng)、近海工程、海上風(fēng)電場等模型一般都要求小于 5 米的空間分辨率，這也造成了模型計(jì)算量顯著增大。

面對計(jì)算量劇增的挑戰(zhàn)，實(shí)驗(yàn)室目前的計(jì)算架構(gòu)主要采取基于 CPU 的多核計(jì)算節(jié)點(diǎn)擴(kuò)展方案為主，以增加核數(shù)、節(jié)點(diǎn)來應(yīng)對，這對高性能集群的建設(shè)和運(yùn)維提出了更高的要求，也進(jìn)一步提高了數(shù)值模型應(yīng)用和拓展的門檻。

采用 OpenACC 框架加速 FVCOM 模型

為了解決數(shù)值模型計(jì)算負(fù)載劇增這一難點(diǎn)問題，華東師范大學(xué)河口海岸學(xué)國家重點(diǎn)實(shí)驗(yàn)室葛建忠教授團(tuán)隊(duì)調(diào)研分析了目前的主要 GPU 加速計(jì)算技術(shù)，包括 CUDA、OpenACC、stdpar、Kokkos、OpenCL 等，并與 NVIDIA 技術(shù)團(tuán)隊(duì)進(jìn)行了詳細(xì)討論和分析，結(jié)合 FVCOM 模型代碼的復(fù)雜度，選擇了 OpenACC 為主的技術(shù)路線，并于 2023 年初開始相關(guān)代碼遷移工作，并在 2023 年 8 月參加了 NVIDIA 舉辦的武漢大學(xué) GPU Hackthon 活動(dòng)，得到了專業(yè)的技術(shù)支持，解決了多個(gè)關(guān)鍵技術(shù)難點(diǎn)，于 2023 年底完成了主要代碼的遷移、測試和驗(yàn)證工作。

為降低大規(guī)模數(shù)值模型的使用門檻，模型代碼的遷移和測試都在一臺(tái)搭載 NVIDIA GeForce RTX 40 系列 GPU 的臺(tái)式電腦上完成，并在 2023 年初完成部署的超算中心計(jì)算節(jié)點(diǎn)上采用 CPU 進(jìn)行對比，該計(jì)算節(jié)點(diǎn)為 Intel Xeon Gold CPU，遷移后的模型支持正壓、斜壓、泥沙、植被等關(guān)鍵模型，并支持全部外部驅(qū)動(dòng)包括風(fēng)場、熱通量、降雨、離線流場、嵌套文件的高效傳輸，也可進(jìn)行單精度、雙精度計(jì)算的自由切換。遷移后模型相關(guān)的輸入、輸出和控制文件未發(fā)生任何變化，可以適用于原有 FVCOM 的相關(guān)應(yīng)用。

加速對比測試選擇 10 萬、35 萬、100 萬、150 萬、200 萬水平方向網(wǎng)格等模型，所有模型都在 RTX GPU 上進(jìn)行單精度模式計(jì)算，并采用計(jì)算節(jié)點(diǎn)進(jìn)行單線程運(yùn)行相同模型。相對于 CPU 單線程計(jì)算速度，采用 OpenACC 技術(shù)的 FVCOM 模型分別達(dá)到了 88、181、194、195、198 倍的加速比（圖 1）。在此基礎(chǔ)上采用編譯器控制選項(xiàng)可以在同一套代碼上靈活切換 CPU 或者 GPU 模式，且經(jīng)檢驗(yàn)，CPU 和 GPU 加速模型都得到一致的模擬結(jié)果。在單精度 FVCOM 的前提下，一個(gè) RTX GPU 的計(jì)算能力在不考慮網(wǎng)絡(luò)交換的情況下相當(dāng)于超算集群的 3.5 個(gè) 64 核計(jì)算節(jié)點(diǎn)，在考慮節(jié)點(diǎn)間網(wǎng)絡(luò)交換延遲時(shí)可相當(dāng)于 5 個(gè)節(jié)點(diǎn)。

圖 1：單精度 GPU-FVCOM 加速實(shí)驗(yàn)結(jié)果

該模型可在 NVIDIA 加速計(jì)算框架體系內(nèi)高效擴(kuò)展，將 10 萬、35 萬、100 萬、150 萬網(wǎng)格模型再調(diào)整為雙精度模式，采用單個(gè) NVIDIA Ampere Tensor Core GPU 進(jìn)行加速計(jì)算，分別達(dá)到了 48、77、139 和 135 的加速比，顯示了對雙精度模式也有良好的加速效果。在多個(gè) GPU 計(jì)算節(jié)點(diǎn)的情況下，也可采用 MPI+OpenACC 方式支持多 GPU 并行計(jì)算。

圖 2：雙精度 GPU-FVCOM 加速實(shí)驗(yàn)結(jié)果

超百倍計(jì)算加速造福海洋預(yù)報(bào)

目前，F(xiàn)VCOM 模型在海洋預(yù)報(bào)、海洋工程與作業(yè)等領(lǐng)域應(yīng)用極為廣泛。以國內(nèi)外近海海洋預(yù)報(bào)業(yè)務(wù)為例，F(xiàn)VCOM 已經(jīng)成為我國沿海省、市、區(qū)各級(jí)海洋預(yù)警預(yù)報(bào)部門開展業(yè)務(wù)化預(yù)報(bào)工作的主要模型選擇。海洋預(yù)報(bào)業(yè)務(wù)的發(fā)展趨勢是不斷提升對預(yù)報(bào)精度與時(shí)效的要求，二者都意味著巨大的算力需求，而將 FVCOM 模型實(shí)現(xiàn) GPU 加速是解決實(shí)際應(yīng)用中劇增的算力需求的有效途徑。

采用 GPU 加速的預(yù)報(bào)模型可以將預(yù)報(bào)時(shí)效從小時(shí)級(jí)別降低到分鐘級(jí)，甚至秒級(jí)。顯著的效率提升也釋放了模型進(jìn)一步采用更高網(wǎng)格分辨率從而提高模擬精度的潛力。

另一方面，業(yè)務(wù)部門對于臺(tái)風(fēng)風(fēng)暴潮等事件的集合預(yù)報(bào)愈發(fā)重視。集合預(yù)報(bào)是指針對不同的初始條件或驅(qū)動(dòng)要素（例如臺(tái)風(fēng)演化過程）的擾動(dòng)，計(jì)算出多個(gè)可能的未來情形，以考慮預(yù)報(bào)中的不確定性。這就對模型的計(jì)算速度提出了更大的挑戰(zhàn)，而 GPU 加速能夠很好地加以應(yīng)對。

在水利工程領(lǐng)域，F(xiàn)VCOM 模型也已廣泛用于工程可行性分析與評估。尤其是在工程前期研究階段，需要借助數(shù)值模型對多種施工建設(shè)方案的效果進(jìn)行模擬評估，多工況計(jì)算對傳統(tǒng)模型也造成了極大挑戰(zhàn)。實(shí)現(xiàn) GPU 加速從而更快地給出論證結(jié)果，則可以切實(shí)地提高工程推進(jìn)效率，節(jié)省工期。

此外，本項(xiàng)目所實(shí)現(xiàn)的案例具有較高的啟示意義與推廣價(jià)值，例如 OpenACC 技術(shù)方案還可以應(yīng)用在其他近海和海洋數(shù)值模型系統(tǒng)。在采用結(jié)構(gòu)化網(wǎng)格的模型中（如ROMS、ECOM、POM 等），該方案甚至可能實(shí)現(xiàn)更好的加速效果。本次實(shí)踐也證明，GPU 加速能夠極大地降低河口、海岸、海洋研究和工程應(yīng)用領(lǐng)域進(jìn)行數(shù)值模擬所需的硬件門檻，為學(xué)科發(fā)展、業(yè)務(wù)應(yīng)用都提供了巨大幫助。

目前，海洋數(shù)值模型正經(jīng)歷其發(fā)展歷程中的最大轉(zhuǎn)型，即從基于動(dòng)力學(xué)機(jī)制與方程的傳統(tǒng)海洋數(shù)值模型轉(zhuǎn)型為基于機(jī)器學(xué)習(xí)（深度學(xué)習(xí)）等方法的人工智能模型。而人工智能模型對數(shù)據(jù)的需求與依賴巨大，其訓(xùn)練通常離不開海量的、可靠的數(shù)據(jù)。然而，海洋系統(tǒng)中的實(shí)測數(shù)據(jù)，相較于海洋巨大的空間尺度以及所關(guān)切問題的具體時(shí)間范圍，總是稀缺的。數(shù)值模型則可以為人工智能模型提供大量的基礎(chǔ)訓(xùn)練數(shù)據(jù)，也是當(dāng)下保障數(shù)據(jù)范圍與質(zhì)量最有效的途徑之一。例如，葛建忠教授團(tuán)隊(duì)已經(jīng)用實(shí)現(xiàn) GPU 加速的 FVCOM 模型系統(tǒng)計(jì)算了中國近海 1960 – 2023 年海洋流場和生態(tài)動(dòng)力過程，用該三維高分辨率模型生成了超 20TB 容量的同化數(shù)據(jù)產(chǎn)品。隨后，通過利用 NVIDIA 開發(fā)的基于 AFNO 架構(gòu)的 FourCastNet 模型對該數(shù)據(jù)集開展訓(xùn)練，他們實(shí)現(xiàn)了對河口及近海動(dòng)力學(xué)過程的快速推演與分析。此外，他們還采用實(shí)現(xiàn) GPU 加速的 FVCOM 模型高效快速地計(jì)算了超過 1000 個(gè)臺(tái)風(fēng)風(fēng)暴潮過程樣本，用于訓(xùn)練一個(gè)基于深度學(xué)習(xí)方法的風(fēng)暴潮預(yù)報(bào)模型。這兩個(gè)數(shù)據(jù)集的構(gòu)建，若采用傳統(tǒng)的、未經(jīng)加速的數(shù)值模型，所耗費(fèi)的時(shí)間成本將高出百倍以上。

綜上，采用 OpenACC 框架的 FVCOM 為傳統(tǒng)動(dòng)力學(xué)數(shù)值模型提供了超過百倍的計(jì)算加速。這樣的效率提升不僅直接造福了海洋預(yù)報(bào)、水利工程等具體應(yīng)用領(lǐng)域，也為海洋模型系統(tǒng)向人工智能模型轉(zhuǎn)型以及人工智能海洋學(xué)的發(fā)展提供了關(guān)鍵的基礎(chǔ)數(shù)據(jù)生成工具和方法，是人工智能技術(shù)進(jìn)一步應(yīng)用于海洋領(lǐng)域的重要基石。

團(tuán)隊(duì)介紹

華東師范大學(xué)河口海岸學(xué)國家重點(diǎn)實(shí)驗(yàn)室葛建忠教授團(tuán)隊(duì)長期致力于海洋數(shù)值模型的研發(fā)與應(yīng)用，是國際先進(jìn)海洋數(shù)值模型 FVCOM 開發(fā)團(tuán)隊(duì)核心成員，主持開發(fā)了其中導(dǎo)堤-丁壩、細(xì)顆粒粘性泥沙、浮泥、河流閘門、植被、藻類漂移生長等 FVCOM 核心模塊，并參與開發(fā)了波流共同作用、FVCOM-ERSEM 生物地球化學(xué)等模塊。此外，該團(tuán)隊(duì)也建立了中國海-長江口多空間尺度物理-生物地球化學(xué)耦合數(shù)值模擬系統(tǒng)。

葛建忠教授團(tuán)隊(duì)基于 FVCOM 框架，主要聚焦高濃度泥沙、物理-生物地球化學(xué)耦合過程、臺(tái)風(fēng)風(fēng)暴潮等方面的研究，并針對長江河口、黃海、浙閩沿海、珠江口和北部灣等國內(nèi)典型河口海岸區(qū)域進(jìn)行了應(yīng)用研究。在德國的易北河口、漢堡港、越南的峴港等區(qū)域，該團(tuán)隊(duì)也開展了相關(guān)合作和應(yīng)用研究，其相關(guān)成果也為國家海洋與水利等部門的黃海滸苔防治、風(fēng)暴潮預(yù)報(bào)、咸潮入侵防御等方面提供了多項(xiàng)技術(shù)支撐。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4793

瀏覽量
102427
人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46060

瀏覽量
234981
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8306

瀏覽量
131841
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5422

瀏覽量
120590
GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
303

瀏覽量
5747

原文標(biāo)題：造福海洋預(yù)報(bào)！采用 OpenACC 框架的 FVCOM 模型實(shí)現(xiàn)超百倍計(jì)算加速

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

opa380異常損壞，放大倍數(shù)衰減十到百倍，不可恢復(fù)，為什么？

在使用opa380時(shí)，經(jīng)常出現(xiàn)原先正常工作的電路，突然信號(hào)值直線下降，輸出信號(hào)衰減十到百倍，但是變化趨勢一致，不可恢復(fù)，更換opa380芯片后正常

發(fā)表于 07-29 06:51

LLM大模型推理加速的關(guān)鍵技術(shù)

LLM（大型語言模型）大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)，旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對LLM大模型推理

發(fā)表于 07-24 11:38 ?496次閱讀

ai大模型和ai框架的關(guān)系是什么

AI大模型和AI框架是人工智能領(lǐng)域中兩個(gè)重要的概念，它們之間的關(guān)系密切且復(fù)雜。 AI大模型的定義和特點(diǎn) AI大模型是指具有大量參數(shù)的深度學(xué)習(xí)模型

發(fā)表于 07-16 10:07 ?3.7w次閱讀

AI大模型與AI框架的關(guān)系

多個(gè)領(lǐng)域取得顯著成果。而AI框架則是為開發(fā)和訓(xùn)練AI模型提供的一套標(biāo)準(zhǔn)接口、特性庫和工具包，它集成了算法的封裝、數(shù)據(jù)的調(diào)用以及計(jì)算資源的使用，是AI算法開發(fā)的必備工具。

發(fā)表于 07-15 11:42 ?622次閱讀

NVIDIA加速計(jì)算和 AI助力數(shù)字銀行揭穿金融欺詐騙局

Bunq 利用 NVIDIA AI 將其欺詐檢測模型的訓(xùn)練速度提高近百倍。 ? 歐洲新型銀行 Bunq 正在 NVIDIA 加速計(jì)算和 AI 的助力下，揭穿金融欺詐者的騙局。被稱為“

發(fā)表于 06-27 17:41 ?640次閱讀

Flow Computing引領(lǐng)CPU性能革命:PPU技術(shù)實(shí)現(xiàn)百倍性能提升

在科技日新月異的今天，芬蘭的一家科技初創(chuàng)公司Flow Computing以其革命性的技術(shù)突破，再次讓全球科技界為之震撼。近日，該公司宣布其研發(fā)的并行處理單元（PPU）成功實(shí)現(xiàn)了對任何CPU架構(gòu)性能高達(dá)100倍的提升，這一成果無疑將引領(lǐng)CPU技術(shù)進(jìn)入全新的SuperCPU時(shí)

發(fā)表于 06-14 14:34 ?779次閱讀

AMD披露高效數(shù)據(jù)中心策略，預(yù)計(jì)至2027年能效提升超百倍

會(huì)議期間，蘇姿豐談?wù)摿薃MD如何通過實(shí)施30x25戰(zhàn)略推動(dòng)2025年計(jì)算節(jié)點(diǎn)能效提升30倍的目標(biāo)。她進(jìn)一步透露，AMD已找到2026年至2027年間將能效提升100倍以上的解決方案。

發(fā)表于 05-24 17:37 ?914次閱讀

谷歌模型框架是什么軟件？谷歌模型框架怎么用？

谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架，其中最著名的是TensorFlow。TensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架，由谷歌的機(jī)器學(xué)習(xí)團(tuán)隊(duì)開發(fā)，用于構(gòu)建和

發(fā)表于 03-01 16:25 ?643次閱讀

華為面向海外發(fā)布通信行業(yè)首個(gè)網(wǎng)絡(luò)大模型—Net Master

MWC24 巴塞羅那期間，在華為企業(yè)業(yè)務(wù)Open Speech現(xiàn)場，華為面向海外發(fā)布通信行業(yè)首個(gè)網(wǎng)絡(luò)大模型——Net Master，旨在滿足網(wǎng)絡(luò)管理服務(wù)提供商（MSP）日益增長的網(wǎng)絡(luò)運(yùn)維需求，提升百倍運(yùn)維效率，推動(dòng)企業(yè)實(shí)現(xiàn)智能化

發(fā)表于 03-01 09:21 ?796次閱讀

谷歌模型框架是什么？有哪些功能和應(yīng)用？

谷歌模型框架（Google Model Framework）并不是一個(gè)特定的框架，而是指谷歌開發(fā)的一系列軟件框架，用于支持機(jī)器學(xué)習(xí)和人工智能的應(yīng)用。以下是一些與谷歌

發(fā)表于 02-29 18:11 ?1223次閱讀

百川智能發(fā)布超千億大模型Baichuan 3

百川智能近日發(fā)布了超千億參數(shù)的大語言模型Baichuan 3，引發(fā)了業(yè)界的廣泛關(guān)注。這款模型在多個(gè)權(quán)威通用能力評測中表現(xiàn)卓越，展現(xiàn)了其強(qiáng)大的語義理解和生成能力。

發(fā)表于 01-31 14:58 ?693次閱讀

有史以來最快的半導(dǎo)體“超原子”能將芯片速度提升千倍

“超原子”（superatomic）材料已成為已知最快的半導(dǎo)體，并且可能導(dǎo)致計(jì)算機(jī)芯片的速度比當(dāng)今任何可用的任何產(chǎn)品快數(shù)百或數(shù)千倍。

發(fā)表于 11-02 09:38 ?711次閱讀

主流大模型推理框架盤點(diǎn)解析

vLLM是一個(gè)開源的大模型推理加速框架，通過PagedAttention高效地管理attention中緩存的張量，實(shí)現(xiàn)了比HuggingFace Transformers高14-24

發(fā)表于 10-10 15:09 ?4355次閱讀

百度發(fā)布首個(gè)量子領(lǐng)域大模型，依托量子平臺(tái)、文心大模型

據(jù)報(bào)道，百度雙邊平臺(tái)和文新大型模式的雙重底的優(yōu)勢為基礎(chǔ)，百度是芯片層、框架層、模型層以及應(yīng)用層等整個(gè)堆棧技術(shù)雙邊技術(shù)和大型模式加快深度融合為目標(biāo)的首次雙邊領(lǐng)域發(fā)表了大

發(fā)表于 09-26 11:09 ?1018次閱讀

今日看點(diǎn)丨百度發(fā)布首個(gè)量子領(lǐng)域大模型，依托量子平臺(tái)、文心大模型；福特暫停采用寧德時(shí)代技術(shù)建設(shè)電池

和量子寫作助手兩大AI原生應(yīng)用。 ? 據(jù)悉，依托百度量子平臺(tái)和文心大模型的雙重底座優(yōu)勢，百度發(fā)布首個(gè)量子領(lǐng)域大模型，旨在芯片層、框架層、

發(fā)表于 09-26 11:06 ?862次閱讀

搜索歷史

采用OpenACC框架的FVCOM模型實(shí)現(xiàn)超百倍計(jì)算加速

評論

opa380異常損壞，放大倍數(shù)衰減十到百倍，不可恢復(fù)，為什么？

LLM大模型推理加速的關(guān)鍵技術(shù)

ai大模型和ai框架的關(guān)系是什么

AI大模型與AI框架的關(guān)系

NVIDIA加速計(jì)算和 AI助力數(shù)字銀行揭穿金融欺詐騙局

Flow Computing引領(lǐng)CPU性能革命:PPU技術(shù)實(shí)現(xiàn)百倍性能提升

AMD披露高效數(shù)據(jù)中心策略，預(yù)計(jì)至2027年能效提升超百倍

谷歌模型框架是什么軟件？谷歌模型框架怎么用？

華為面向海外發(fā)布通信行業(yè)首個(gè)網(wǎng)絡(luò)大模型—Net Master

谷歌模型框架是什么？有哪些功能和應(yīng)用？

百川智能發(fā)布超千億大模型Baichuan 3

有史以來最快的半導(dǎo)體“超原子”能將芯片速度提升千倍

主流大模型推理框架盤點(diǎn)解析

百度發(fā)布首個(gè)量子領(lǐng)域大模型，依托量子平臺(tái)、文心大模型

今日看點(diǎn)丨百度發(fā)布首個(gè)量子領(lǐng)域大模型，依托量子平臺(tái)、文心大模型；福特暫停采用寧德時(shí)代技術(shù)建設(shè)電池