在學(xué)校上課的時候一般習(xí)慣帶著電腦去教室,選用輕薄的辦公本或者 Mac整天帶著到處跑。但從校園跨入社會后突然發(fā)現(xiàn)辦公場景慢慢從移動辦公轉(zhuǎn)為固定場所的辦公,公司因為保密等原因不能帶私人電腦進(jìn)公司,在家用辦公本性能又不夠用,甚至由于寫代碼的原因,電腦性能需要同時支持4K屏游戲+2K屏視頻工作,直播,于是對于新機(jī)器性能的高要求促使我要在現(xiàn)存市場找到一款高性能的主機(jī)設(shè)備。
思考再三,顧及到辦公桌被兩個顯示器占滿的空間,開始尋找輕量級高性能的主機(jī)設(shè)備,最后將視線落到了英特爾NUC12蝰蛇峽谷(Serpent Canyon)上來。NUC全稱為Next Unit of Computing,是英特爾2013年推出的迷你主機(jī),寓意下一世代主機(jī)。特點是外形小巧,在超迷你電腦這一塊,Intel NUC一直都是業(yè)界標(biāo)桿。
機(jī)器的CPU選的是i7-12700H,采用了6大核8小核的設(shè)計,實現(xiàn)了14核20線程的超高規(guī)格。這是一款采用了intel 10nm工藝的最新處理器,采用 BGA1744的 Alder Lake-H 架構(gòu),基準(zhǔn)頻率為2.69GHz,最大睿頻可達(dá)4.7GHz,而小核的最大睿頻可達(dá)3.5GHz,TDP為45W,最大可配置為115W,三級緩存高達(dá)24MB。
顯卡方面的Arc A770M采用的ACM-G10核心,基于臺積電N6 6nm制程工藝,集成32個Xe核心,擁有4096個流處理器,256個紋理單元、128個ROP單元。
NUC12蝰蛇峽谷在極其有限的空間內(nèi),集成了i7-12000H處理器和Arc A770M 16GB獨顯這樣的高性能硬件。此外,該 NUC 提供兩個 DDR4-3200 SO-DIMM 內(nèi)存插槽,最大容量 64GB,可選傲騰內(nèi)存加速。兩個 M.2 2280 PCIe 4.0 x4 SSD 插槽,一個 M.2 2280 PCIe 3.0 x4/SATA SSD 插槽,提供的這些擴(kuò)展接口能夠大大滿足日常使用的辦公與游戲需求。從外觀上看,NUC12蝰蛇峽谷的寬度與茶杯一致,拋棄掉厚重的機(jī)箱,將整臺主機(jī)濃縮到短小精悍的設(shè)備中。主機(jī)的側(cè)面與頂部提供整片的散熱孔,在運(yùn)行過程中沒有散熱產(chǎn)生的噪聲,而且設(shè)備溫度也保持在比較穩(wěn)定的水平。
此外,最讓我看中的是英特爾 Arc A770M GPU 擁有 16 GB GDDR6 顯存,通過針對游戲和最新視覺技術(shù)優(yōu)化的新微架構(gòu)提升游戲性能,包括 AI 增強(qiáng)升級、實時光線追蹤和對 DirectX 12 Ultimate 的全面支持。
由于職業(yè)習(xí)慣,在了解到機(jī)器擁有的大顯存后開始思考能不能在機(jī)器上部署跑深度學(xué)習(xí)相關(guān)的任務(wù)。事實上,目前A卡雖然不能使用cuda,但是也提供了一整套開源的ROCm(Radeon Open Compute)框架,相比于CUDA,ROCm擁有比更強(qiáng)的包容性和開放性。和CUDA只能在特定型號的NVIDIA GPU上運(yùn)行不同,ROCm希望能在各種不同的硬件上運(yùn)行。
首先安裝好 Ubuntu的操作系統(tǒng)和 AMD ROCm 平臺,配置好GPU訪問權(quán)與PATH環(huán)境變量,再通過 Docker 部署好 ROCm 版的 PyTorch 后就可以運(yùn)行 PyTorch 代碼進(jìn)行使用了,由于ROCm的PyTorch并沒有完全在每種GPU上支持PyTorch的全部CUDA函數(shù),小部分很有可能通過不了。
在部署完環(huán)境后就開始測試,我們選用 OpenVINO 用來部署訓(xùn)練模型做推理。OpenVINO是一個Pipeline工具集,同時可以兼容各種開源框架訓(xùn)練好的模型,擁有算法模型上線部署的各種能力,只要掌握了該工具,你可以輕松的將預(yù)訓(xùn)練模型在Intel上快速部署起來。
選擇部署 YOLO v5來測試深度學(xué)習(xí)環(huán)境,把訓(xùn)練好的模型文件可視化看看,通過Netron,查看yolov5s.onnx模型的輸入和輸出。
通過 OpenVISO 加載 YOLO v5 的模型后進(jìn)行性能測試:
Inference 的速度大概在8-10 ms 左右,證明在該設(shè)備上能穩(wěn)定、高效的運(yùn)行模型,等再體驗一段時間后試試對最近大火的 stable diffusion 進(jìn)行嘗試。接下來還是先通過3DMark測試來確認(rèn)其性能表現(xiàn)。測試模式為CPU Profile、Speed Way以及3DMark新增的Intel XeSS。CPU Profile 涉及的是一個名為“Boids”,也就是類鳥群體的計算框架,這個框架很容易被并行化計算,因此較為適合考察單線程到多線程的性能變化情況。Speed Way GPU 基準(zhǔn)測試程序,使用光線追蹤和實時全局照明來渲染逼真的照明和反射,支持 DirectX 12 Ultimate 功能來優(yōu)化性能和視覺質(zhì)量,而XeSS則是針對英特爾XeSS超采樣技術(shù)的專項測試。
3DMark CPU Profile的最大線程成績,代表了CPU在使用所有可用的線程時的全部性能潛能。對應(yīng)的實際使用情況是在游戲之外的極其繁重的多線程工作負(fù)載中,例如電影質(zhì)量的渲染、模擬和科學(xué)分析這些應(yīng)用場景。而16線程成績,代表了需要密集計算的任務(wù)下處理器的能力,例如數(shù)碼內(nèi)容創(chuàng)建和3D渲染都得益于多線程,可以看到該項得分也達(dá)到了相當(dāng)優(yōu)秀的得分。
Speed Way GPU 在帶動4K主屏+2K副屏的前提下也能達(dá)到比較不錯的得分水平。
3DMark XeSS測試兩次生成基于3DMarkPortRoyal基準(zhǔn)的場景,第一次運(yùn)行通過使用時間抗鋸齒(TAA)渲染場景以獲得所需的輸出分辨率來計算基線性能。第二遍以較低的分辨率渲染舞臺,然后利用指定的XeSS模式放大幀。結(jié)果顯示每次運(yùn)行的平均每秒幀數(shù)以及定義為百分比的性能差異。在XeSS 打開后,畫面表現(xiàn)效果在4K分辨率下直接提升了45%。
隨后也對一些主流游戲進(jìn)行了簡單的體驗,在原神的4K高配60幀的環(huán)境下測試發(fā)現(xiàn)跑圖過程非常流暢,對于一些場景切換與密集建模的地方也有比較穩(wěn)定的幀率。
總結(jié):
作為一臺兼顧辦公工作與娛樂游戲的高性能的主機(jī),英特爾NUC消費迷你主機(jī)在一本專業(yè)書的厚度下提供了如此強(qiáng)勁的性能體驗,而且包括CPU的多線程性能以及顯卡的16G顯存,能同時支撐深度學(xué)習(xí)場景以及游戲場景的兼顧,而且主機(jī)酷炫的外表,性能強(qiáng)悍,擴(kuò)展豐富等優(yōu)點也擴(kuò)展了應(yīng)用場景和需求。總的看下來屬于幾乎沒有短板、而且優(yōu)勢明顯的迷你計算機(jī),適合輕度和中度的辦公人群日常使用。另外蝰蛇峽谷從開始發(fā)售9999元到現(xiàn)在已降至7000元左右,還在等待的朋友可以沖了。
審核編輯 黃宇
-
電腦主機(jī)
+關(guān)注
關(guān)注
0文章
27瀏覽量
10747 -
Nuc
+關(guān)注
關(guān)注
0文章
63瀏覽量
12828
發(fā)布評論請先 登錄
相關(guān)推薦
評論