NVIDIA CUDA鼎鼎大名,不過,從一開始,該技術(shù)就為N卡獨享。
盡管已經(jīng)有一些工具能讓CUDA為OpenCL環(huán)境所用,但即便先進如HIPCL也還是一款半自動化工具,需要開發(fā)者手動干預(yù)。
好消息是,名為ZLUDA的新工具誕生了,簡單來說可依然配置Intel核顯(6代酷睿Skylake及以上)的系統(tǒng)使用上CUDA加速。
盡管號稱效率和本地化幾乎無異,但似乎僅被較好地用在Geekbench上。官方基于Linux的測試顯示,UHD 630核顯(Core i7-8700K)開啟CUDA后跑分能到6333,雖然分數(shù)比原生OpenCL的6482低,但部分測試子項中,CUDA加速還是起到了不小的buff加成作用,幅度最高有52%。
遺憾的是,有媒體嘗試從GitHub頁面下載ZLUDA后,在Tiger Lake筆記本上操作,Geekbench 5報錯了……
責編AJX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達在GPU領(lǐng)域最大的護城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)生態(tài)則更加穩(wěn)固,AMD
發(fā)表于 07-19 00:16
?4097次閱讀
神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。 ? 英偉達——CUDA的絕對統(tǒng)治 ? 相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUDA。CUDA在后端架構(gòu)上處于絕對的統(tǒng)
發(fā)表于 06-20 00:09
?3343次閱讀
Aerial CUDA 加速無線接入網(wǎng) (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。
發(fā)表于 05-24 11:10
?414次閱讀
德國、日本和波蘭的超級計算機利用 Grace-Hopper 和量子-經(jīng)典加速超算平臺推進量子計算研究 ? ? 德國漢堡 —— 國際超算大會(ISC)—— 2024 年 5 月 13 日
發(fā)表于 05-13 15:21
?154次閱讀
\'
ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
發(fā)表于 04-11 07:56
vLLM 中,LLM 推理的 prefill 階段 attention 計算使用第三方庫 xformers 的優(yōu)化實現(xiàn),decoding 階段 attention 計算則使用項目編譯 CUDA 代碼實現(xiàn)。
發(fā)表于 01-09 11:43
?1455次閱讀
在最近的一場“AI Everywhere”發(fā)布會上,Intel的CEO Pat Gelsinger炮轟Nvidia的CUDA生態(tài)護城河并不深,而且已經(jīng)成為行業(yè)的眾矢之的。
發(fā)表于 12-28 10:26
?1.2w次閱讀
OpenCV4支持通過GPU實現(xiàn)CUDA加速執(zhí)行,實現(xiàn)對OpenCV圖像處理程序的加速運行,當前支持加速的模塊包括如下。
發(fā)表于 12-05 09:56
?845次閱讀
OpenCV4.8+CUDA+擴展模塊支持編譯指南
發(fā)表于 11-30 16:45
?732次閱讀
虛擬像素(動態(tài)像素)技術(shù)的廣泛引入,更是引發(fā)了行業(yè)對LED直顯未來發(fā)展趨勢的重新審視:對此,行業(yè)專家表示,LED微間距直顯的性能、技術(shù)與經(jīng)濟性“不可能三角”的破解,似乎找到了新方向。
發(fā)表于 11-28 10:12
?386次閱讀
酷睿Ultra將帶來Intel處理器誕生52年來史上最大的一次變革,首次在消費級領(lǐng)域采用分離式模塊化架構(gòu),升級全新的Intel 4制造工藝和封裝技術(shù)、全新的CPU架構(gòu)與3D高性能混合架構(gòu)、全新的銳炫GPU核
發(fā)表于 11-24 14:29
?492次閱讀
,對 Pytorch的AMP ( autocast與Gradscaler 進行對比) 自動混合精度對模型訓(xùn)練加速 。 注意Pytorch1.6+,已經(jīng)內(nèi)置torch.cuda.amp,因此便不需要加載
發(fā)表于 11-03 10:00
?1397次閱讀
前言最近由于項目需要,之前我們在利用GPU進行深度學(xué)習的時候,都要去NVIDIA的官網(wǎng)下載CUDA的安裝程序和cudnn的壓縮包,然后再進行很繁瑣的系統(tǒng)環(huán)境配置。不僅環(huán)境配置麻煩,而且還特別容易配置
發(fā)表于 10-10 10:16
?1071次閱讀
CUDA核心(Compute Unified Device Architecture Core)是NVIDIA圖形處理器(GPU)上的計算單元,用于執(zhí)行并行計算任務(wù)。每個CUDA核心可以執(zhí)行單個線程的指令,包括算術(shù)運算、邏輯操作和內(nèi)存訪問等。
發(fā)表于 09-27 09:38
?7511次閱讀
電子發(fā)燒友網(wǎng)站提供《8位AVR內(nèi)核可以做什么.pdf》資料免費下載
發(fā)表于 09-25 09:37
?0次下載
評論