0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA驅(qū)動(dòng)程序支持OpenCL和Vulkan進(jìn)行互操作

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-10 11:41 ? 次閱讀

OpenCL 正在改進(jìn)與其他 API (如 Vulkan )的互操作方式。本文向您介紹了最新的 OpenCL 互操作風(fēng)格,最新的NVIDIA驅(qū)動(dòng)程序已經(jīng)支持這種風(fēng)格。我們提供了可下載的示例代碼,所以您今天可以嘗試這個(gè)新功能。

需要一種新的互操作方式

開(kāi)發(fā)人員通常將 OpenCL for compute 與其他 API (如 OpenGL )一起使用,以訪問(wèn)包括圖形渲染在內(nèi)的功能。 OpenCL 長(zhǎng)期以來(lái)一直支持通過(guò)擴(kuò)展與 OpenGL 、 OpenGL ES 、 EGL 、 Direct3D 10 和 Direct3D 11 共享隱式緩沖區(qū)和圖像對(duì)象:

cl_khr_gl_sharing

cl_khr_gl_event

cl_khr_egl_image

cl_khr_egl_event

cl_khr_d3d10_sharing

cl_khr_d3d11_sharing

新一代 GPU API (如 Vulkan )使用對(duì)外部?jī)?nèi)存的顯式引用以及信號(hào)量來(lái)協(xié)調(diào)對(duì)共享資源的訪問(wèn)。到目前為止,還沒(méi)有 OpenCL 擴(kuò)展來(lái)支持外部?jī)?nèi)存和信號(hào)量與這類新的 API 共享。

OpenCL 和 Vulkan 之間的互操作在移動(dòng)和桌面平臺(tái)上都有很強(qiáng)的需求。 NVIDIA 與 Khronos OpenCL 工作組密切合作,發(fā)布了一套臨時(shí)跨供應(yīng)商的 KHR 擴(kuò)展。這些擴(kuò)展使應(yīng)用程序能夠在 OpenCL 和 Vulkan 等 API 之間高效地共享數(shù)據(jù),與使用隱式資源的前一代互操作 API 相比,靈活性顯著提高。

這組新的外部?jī)?nèi)存和信號(hào)量共享擴(kuò)展提供了一個(gè)通用框架,使 OpenCL 能夠使用 Vulkan 開(kāi)發(fā)人員熟悉的方法導(dǎo)入外部 API 導(dǎo)出的外部?jī)?nèi)存和信號(hào)量句柄。然后, OpenCL 使用這些信號(hào)量來(lái)同步外部運(yùn)行時(shí),協(xié)調(diào)共享內(nèi)存的使用。

圖 1 。 OpenCL 與 Vulkan 軟件的互操作關(guān)系

然后可以添加特定于 API 的外部互操作擴(kuò)展,以處理與特定 API 交互的細(xì)節(jié)。 Vulkan 互操作現(xiàn)在可用,并計(jì)劃使用其他 API ,如 DirectX 12 。

OpenCL 新的外部信號(hào)量和內(nèi)存共享功能包括單獨(dú)的一組精心構(gòu)造的擴(kuò)展。

信號(hào)量擴(kuò)展

這組擴(kuò)展增加了從操作系統(tǒng)特定的信號(hào)量句柄創(chuàng)建 OpenCL 信號(hào)量對(duì)象的能力。

cl_khr_semaphore – 表示帶有等待和信號(hào)的信號(hào)量。這是一個(gè)新的 OpenCL 對(duì)象類。

cl_khr_external_semaphore – 使用導(dǎo)入和導(dǎo)出外部信號(hào)量的機(jī)制擴(kuò)展cl_khr_semaphore,類似于 VK_KHR_external_semaphore 。

以下擴(kuò)展使用特定于句柄類型的行為擴(kuò)展cl_khr_external_semaphore:

cl_khr_external_semaphore_opaque_fd – 使用帶有引用傳輸?shù)?Linux fd 句柄共享外部信號(hào)量,類似于 VK_KHR_external_semaphore_fd 。

cl_khr_external_semaphore_win32 – 與 VK_KHR_external_semaphore_win32 類似,使用 win32 NT 和 KMT 句柄與引用轉(zhuǎn)移共享外部信號(hào)量。

內(nèi)存擴(kuò)展

這些擴(kuò)展增加了從操作系統(tǒng)特定的內(nèi)存句柄創(chuàng)建 OpenCL 內(nèi)存對(duì)象的能力。它們的設(shè)計(jì)與 Vulkan 外部存儲(chǔ)器擴(kuò)展 VK_KHR_external_memory 。 類似

cl_khr_external_memory – 從其他 API 導(dǎo)入外部?jī)?nèi)存。

以下擴(kuò)展使用特定于句柄類型的行為擴(kuò)展cl_khr_external_memory:

cl_khr_external_memory_opaque_fd – 使用 Linux fd 句柄共享外部?jī)?nèi)存,類似于 VK_KHR_external_memory_fd 。

cl_khr_external_memory_win32 – 使用 win32 NT 和 KMT 句柄共享外部?jī)?nèi)存,類似于 VK_KHR_external_memory_win32 。

使用 OpenCL

典型的互操作用例包括以下步驟。

檢查所需的支持是否可用:

檢查底層 OpenCL 平臺(tái)和帶有clGetPlatformInfo和clGetDeviceInfo的設(shè)備是否支持所需的擴(kuò)展cl_khr_external_semaphore和cl_khr_external_memory。

為了能夠使用 Win32 信號(hào)量和內(nèi)存句柄,請(qǐng)檢查cl_khr_external_semaphore_win32_khr和cl_khr_external_memory_win32_khr擴(kuò)展是否存在。

為了能夠使用 FD 信號(hào)量和內(nèi)存句柄,請(qǐng)檢查cl_khr_external_semaphore_opaque_fd_khr和cl_khr_external_memory_opaque_fd_khr擴(kuò)展是否存在。這也可以通過(guò)查詢支持的句柄類型來(lái)檢查。

導(dǎo)入外部信號(hào)量需要cl_khr_external_semaphore。如果支持cl_khr_external_semaphore_opaque_fd,則可以使用clCreateSemaphoreWithPropertiesKHR和 OpenCL 中的 FD 句柄導(dǎo)入 Vulkan 導(dǎo)出的外部信號(hào)量。

// Get cl_devices of the platform. clGetDeviceIDs(..., &devices, &deviceCount); // Create cl_context with just first device clCreateContext(..., 1, devices, ...); // Obtain fd/win32 or similar handle for external semaphore to be imported from the other API. int fd = getFdForExternalSemaphore();// Create clSema of type cl_semaphore_khr usable on the only available device assuming the semaphore was imported from the same device. cl_semaphore_properties_khr sema_props[] = {(cl_semaphore_properties_khr)CL_SEMAPHORE_TYPE_KHR, (cl_semaphore_properties_khr)CL_SEMAPHORE_TYPE_BINARY_KHR, (cl_semaphore_properties_khr)CL_SEMAPHORE_HANDLE_OPAQUE_FD_KHR, (cl_semaphore_properties_khr)fd, 0}; int errcode_ret = 0; cl_semaphore_khr clSema = clCreateSemaphoreWithPropertiesKHR(context, sema_props, &errcode_ret);

導(dǎo)入圖像需要cl_khr_external_memory和對(duì)圖像的支持。在 OpenCL 中,通過(guò)clCreateSemaphoreWithPropertiesKHR使用 Win32 句柄導(dǎo)入 Vulkan 導(dǎo)出的外部信號(hào)量。

// Get cl_devices of the platform. clGetDeviceIDs(..., &devices, &deviceCount); // Create cl_context with just first device clCreateContext(..., 1, devices, ...); // Obtain fd/win32 or similar handle for external semaphore to be imported from the other API. void *handle = getWin32HandleForExternalSemaphore();  // Create clSema of type cl_semaphore_khr usable on the only available device assuming the semaphore was imported from the same device. cl_semaphore_properties_khr sema_props[] = {(cl_semaphore_properties_khr)CL_SEMAPHORE_TYPE_KHR, (cl_semaphore_properties_khr)CL_SEMAPHORE_TYPE_BINARY_KHR, (cl_semaphore_properties_khr)CL_SEMAPHORE_HANDLE_OPAQUE_WIN32_KHR, (cl_semaphore_properties_khr)handle, 0}; int errcode_ret = 0; cl_semaphore_khr clSema = clCreateSemaphoreWithPropertiesKHR(context, sema_props, &errcode_ret);

在 OpenCL 中,使用 FD 句柄將 Vulkan 導(dǎo)出的外部?jī)?nèi)存作為緩沖內(nèi)存與clCreateBufferWithProperties一起導(dǎo)入。

// Get cl_devices of the platform. 
clGetDeviceIDs(..., &devices, &deviceCount); 
 
// Create cl_context with just first device 
clCreateContext(..., 1, devices, ...); 
 
// Obtain fd/win32 or similar handle for external memory to be imported from other API. 
int fd = getFdForExternalMemory(); 
 
// Create extMemBuffer of type cl_mem from fd. 
cl_mem_properties_khr extMemProperties[] = 
{ (cl_mem_properties_khr)CL_EXTERNAL_MEMORY_HANDLE_OPAQUE_FD_KHR, 
 (cl_mem_properties_khr)fd,
0

}; 
cl_mem extMemBuffer = clCreateBufferWithProperties(/*context*/ clContext, 
 /*properties*/ extMemProperties, 
 /*flags*/ 0, 
 /*size*/ size, 
 /*host_ptr*/ NULL, 
 /*errcode_ret*/ &errcode_ret);

在 OpenCL 中,使用clCreateImageWithProperties將 Vulkan 導(dǎo)出的外部?jī)?nèi)存作為圖像內(nèi)存導(dǎo)入。

// Create img of type cl_mem. Obtain fd/win32 or similar handle for external memory to be imported from other API. int fd = getFdForExternalMemory(); // Set cl_image_format based on external image info cl_image_format clImgFormat = { }; clImageFormat.image_channel_order = CL_RGBA; clImageFormat.image_channel_data_type = CL_UNORM_INT8; // Set cl_image_desc based on external image info size_t clImageFormatSize; cl_image_desc image_desc = { }; image_desc.image_type = CL_MEM_OBJECT_IMAGE2D_ARRAY; image_desc.image_width = width; image_desc.image_height = height; image_desc.image_depth = depth; cl_mem_properties_khr extMemProperties[] = { (cl_mem_properties_khr)CL_EXTERNAL_MEMORY_HANDLE_OPAQUE_FD_KHR, (cl_mem_properties_khr)fd, 0 }; cl_mem img = clCreateImageWithProperties(/*context*/ clContext, /*properties*/ extMemProperties, /*flags*/ 0, /*image_format*/ &clImgFormat, /*image_desc*/ &image_desc, /*errcode_ret*/ &errcode_ret)

使用信號(hào)量 wait 和 signal 在 OpenCL 和 Vulkan 之間同步。

// Create clSema using one of the above examples of external semaphore creation. int errcode_ret = 0; cl_semaphore_khr clSema = clCreateSemaphoreWithPropertiesKHR(context, sema_props, &errcode_ret); while (true) { // (not shown) Signal the semaphore from the other API, // Wait for the semaphore in OpenCL clEnqueueWaitSemaphoresKHR( /*command_queue*/ command_queue, /*num_sema_objects*/ 1, /*sema_objects*/ &clSema, /*num_events_in_wait_list*/ 0, /*event_wait_list*/ NULL, /*event*/ NULL); clEnqueueNDRangeKernel(command_queue, ...); clEnqueueSignalSemaphoresKHR(/*command_queue*/ command_queue, /*num_sema_objects*/ 1, /*sema_objects*/ &clSema, /*num_events_in_wait_list*/ 0, /*event_wait_list*/ NULL, /*event*/ NULL); // (not shown) Launch work in the other API that waits on 'clSema'

關(guān)于作者

Nikhil Joshi 目前在NVIDIA 管理 OpenCL 驅(qū)動(dòng)程序團(tuán)隊(duì)。他還代表 NVIDIA 參加 Khronos OpenCL 工作組。他在 NVIDIA 的計(jì)算團(tuán)隊(duì)工作了 10 多年,致力于不同的計(jì)算 API ,包括 CUDA 、 Renderscript 和 OpenCL

Rekha Mukund 是 NVIDIA 計(jì)算組的產(chǎn)品經(jīng)理,負(fù)責(zé)為汽車、 Jetson 和 Android 平臺(tái)開(kāi)發(fā) CUDA Tegra 產(chǎn)品。她還負(fù)責(zé)管理 NVIDIA SimNet 產(chǎn)品和 OpenCL 計(jì)劃。在加入 NVIDIA 之前, Rekha 在付費(fèi)電視技術(shù)領(lǐng)域與思科合作了八年多。她是英國(guó)大學(xué)計(jì)算機(jī)科學(xué)學(xué)院的金牌獲得者,他是印度國(guó)家級(jí)乒乓球運(yùn)動(dòng)員和狂熱的旅行者。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7366

    瀏覽量

    163092
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102429
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    6545

    瀏覽量

    122743
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA-SMI因?yàn)闊o(wú)法與NVIDIA驅(qū)動(dòng)程序通信而失敗

    你好,我有一個(gè)奇怪的問(wèn)題,一切都很好,運(yùn)作良好,但在一瞬間新的虛擬機(jī)點(diǎn)開(kāi)始。當(dāng)我嘗試檢查問(wèn)題時(shí),在“nvidia-smi”命令之后,我有“NVIDIA-SMI失敗,因?yàn)樗鼰o(wú)法與NVIDIA驅(qū)動(dòng)
    發(fā)表于 09-10 17:09

    VM Win7 Xenserver 7 Nvidia Grid 369.71驅(qū)動(dòng)程序不應(yīng)用

    大家好;我全新安裝了Xenserver 7.0并應(yīng)用了所有發(fā)布補(bǔ)丁。該服務(wù)器是戴爾R720,它有兩個(gè)nvidia K2卡,我還從公共Nvidia驅(qū)動(dòng)程序網(wǎng)站安裝了nvidia網(wǎng)格
    發(fā)表于 09-19 16:54

    nvidia不再提供網(wǎng)格驅(qū)動(dòng)程序

    的一行,“從版本375開(kāi)始,NVIDIA驅(qū)動(dòng)程序不再支持NVIDIA GRID K2,K1,K520和K340產(chǎn)品?!比绻?b class='flag-5'>nvidia停止發(fā)
    發(fā)表于 09-27 16:08

    NVIDIA OpenGL驅(qū)動(dòng)程序問(wèn)題,錯(cuò)誤代碼9 - NVIDIA GRID K2

    我們的工程師在“蒸餾”模式下打開(kāi)CATIAv6模型時(shí)遇到了問(wèn)題。我希望有人可以提供幫助。錯(cuò)誤信息:NVIDIA OpenGL驅(qū)動(dòng)程序檢測(cè)到顯示驅(qū)動(dòng)程序出現(xiàn)問(wèn)題,無(wú)法繼續(xù)。申請(qǐng)必須關(guān)閉。錯(cuò)誤代碼
    發(fā)表于 10-08 14:20

    GPU如何在imx8m plus上工作以及GPU驅(qū)動(dòng)程序如何集成到DRM驅(qū)動(dòng)程序框架中?

    我正在研究 imx8m plus 的 DRM 驅(qū)動(dòng)程序。在linux內(nèi)核源代碼中,我找到了CRTC、Encoder和Connector的驅(qū)動(dòng)源,但是GPU驅(qū)動(dòng)在哪里呢?我知道 vivante GPU
    發(fā)表于 06-08 08:23

    基于eCos操作系統(tǒng)的FLASH驅(qū)動(dòng)程序分析與移植

    基于eCos操作系統(tǒng)的FLASH驅(qū)動(dòng)程序分析與移植 0 引 言   嵌入式系統(tǒng)需要支持的外部設(shè)備種類繁多,如何構(gòu)造運(yùn)行良好的嵌入式設(shè)備的驅(qū)動(dòng)程序,對(duì)嵌入式
    發(fā)表于 12-28 10:50 ?1229次閱讀
    基于eCos<b class='flag-5'>操作</b>系統(tǒng)的FLASH<b class='flag-5'>驅(qū)動(dòng)程序</b>分析與移植

    Linux驅(qū)動(dòng)程序缺陷檢測(cè)研究

    驅(qū)動(dòng)程序操作系統(tǒng)的重要組成部分。驅(qū)動(dòng)程序運(yùn)行于內(nèi)核態(tài),其可靠性對(duì)于操作系統(tǒng)的安全可靠非常關(guān)鍵。針對(duì)Linux驅(qū)動(dòng)程序,研究基于符號(hào)執(zhí)行的
    發(fā)表于 11-21 15:26 ?9次下載
    Linux<b class='flag-5'>驅(qū)動(dòng)程序</b>缺陷檢測(cè)研究

    Linux設(shè)備驅(qū)動(dòng)程序的平臺(tái)驅(qū)動(dòng)程序和字符驅(qū)動(dòng)程序介紹

    了解Linux設(shè)備驅(qū)動(dòng)程序的基礎(chǔ)知識(shí),重點(diǎn)介紹平臺(tái)驅(qū)動(dòng)程序和字符驅(qū)動(dòng)程序。 提出了簡(jiǎn)單的平臺(tái)驅(qū)動(dòng)程序實(shí)現(xiàn)和簡(jiǎn)單的字符驅(qū)動(dòng)程序實(shí)現(xiàn)。
    的頭像 發(fā)表于 11-27 06:32 ?4181次閱讀

    NVIDIA發(fā)布Geforce 460.89:支持Vulkan光追

    、指南也同步更新介紹了光追技術(shù)。 Vulkan對(duì)于光追的支持已經(jīng)集成于DXC,也就是微軟的開(kāi)源HLSL編譯器,因此開(kāi)發(fā)者可以在Vulkan光追程序中使用HLSL著色器,包括從微軟DXR
    的頭像 發(fā)表于 12-16 13:32 ?6161次閱讀

    Vulkan 1.3幫助實(shí)現(xiàn)跨平臺(tái)功能

      NVIDIA 和其他 Khronos 成員開(kāi)發(fā)的 Vulkan 最常被要求的擴(kuò)展中,共有 23 個(gè)現(xiàn)在被納入全新的 Vulkan 1.3 核心規(guī)范。 NVIDIA 已經(jīng)準(zhǔn)備好了第一
    的頭像 發(fā)表于 04-02 15:51 ?1876次閱讀

    使用Vulkan SC進(jìn)行安全關(guān)鍵圖形和實(shí)時(shí)GPU處理

      NVIDIA 幫助領(lǐng)導(dǎo)了 Vulkan SC 1.0 API 的創(chuàng)建,目前正在其 NVIDIA -DRIVE 和 NVIDIA Jetson 平臺(tái)上運(yùn)送生產(chǎn)
    的頭像 發(fā)表于 10-11 11:21 ?1266次閱讀

    了解和使用無(wú)操作系統(tǒng)和平臺(tái)驅(qū)動(dòng)程序

    快速發(fā)展的技術(shù)需要軟件支持(固件驅(qū)動(dòng)程序和示例代碼)來(lái)簡(jiǎn)化過(guò)程中的設(shè)計(jì)。本文介紹如何使用no-OS(無(wú)操作系統(tǒng))驅(qū)動(dòng)程序和平臺(tái)驅(qū)動(dòng)程序,通過(guò)
    的頭像 發(fā)表于 12-15 14:28 ?1076次閱讀
    了解和使用無(wú)<b class='flag-5'>操作</b>系統(tǒng)和平臺(tái)<b class='flag-5'>驅(qū)動(dòng)程序</b>

    摩爾線程正式發(fā)布Linux驅(qū)動(dòng)程序

    近日,摩爾線程正式發(fā)布Linux驅(qū)動(dòng)程序,面向MTT S80桌面級(jí)顯卡,版本號(hào)為v2.1.0。該驅(qū)動(dòng)程序,在Ubuntu 20.04.1版本下支持OpenGL 4.0和Vulkan 1
    的頭像 發(fā)表于 07-05 10:56 ?1038次閱讀

    NVIDIA顯卡驅(qū)動(dòng)下載哪個(gè)?NVIDIA顯卡驅(qū)動(dòng)下載方法

    關(guān)于下載哪個(gè)NVIDIA顯卡驅(qū)動(dòng),建議您下載最新版本的官方驅(qū)動(dòng)程序,以確保顯卡性能的穩(wěn)定性和最佳體驗(yàn)。同時(shí),也可以根據(jù)您的電腦型號(hào)和配置,選擇適合您的驅(qū)動(dòng)程序版本。如果您不確定應(yīng)該下載
    的頭像 發(fā)表于 03-01 17:11 ?2176次閱讀

    Linux設(shè)備驅(qū)動(dòng)程序分類有哪些

    Linux設(shè)備驅(qū)動(dòng)程序操作系統(tǒng)與硬件設(shè)備之間的橋梁,負(fù)責(zé)實(shí)現(xiàn)硬件設(shè)備與操作系統(tǒng)之間的通信和控制。Linux設(shè)備驅(qū)動(dòng)程序的分類繁多,可以根據(jù)不同的標(biāo)準(zhǔn)
    的頭像 發(fā)表于 08-30 15:11 ?164次閱讀