91久久偷偷做嫩草影院,99久久久精品综合

解決處理器與內(nèi)存之間通信瓶頸之路永無止境。

幾年后，服務(wù)器可能看起來與現(xiàn)在有所不同，那時，存儲和處理器會被放在彼此獨立的機箱內(nèi)。一種名為 CXL（Compute Express Link)的互連技術(shù)正在使這成為可能。

CXL是由電腦科技的行業(yè)巨頭組成的聯(lián)盟— Compute Express Link Consor tium（CXL Consortium）所開發(fā)和定義的，主要成員包括英特爾(Intel)、AMD、三星(Samsung) 、SK海力士(SKHynix)、美光(Micron)、戴爾(Dell)、惠普企業(yè)(Hewlett Packard Enterprise)、Microchip Technolog等。CXL 協(xié)定發(fā)展經(jīng)歷過1.0、1.1、2.0、以及最新的3.0版本，如今市場上已經(jīng)陸續(xù)出現(xiàn)支援CXL 1.1 和2.0 的產(chǎn)品，3.0 協(xié)定還在開發(fā)中；協(xié)定本身更是吸引了一群大型科技公司積極參與其中。

該技術(shù)的升級規(guī)范，3.1版，于本周發(fā)布。更新提供了更快、更安全的計算環(huán)境和更強大的技術(shù)基礎(chǔ)，可將數(shù)據(jù)中心轉(zhuǎn)變?yōu)榫扌头?wù)器。

新規(guī)范將支持 DDR6 內(nèi)存，該內(nèi)存仍在開發(fā)中。DDR 標(biāo)準(zhǔn)制定組織 JEDEC 尚未廣泛討論 DDR6。

目前，英特爾和AMD的服務(wù)器芯片支持DDR5，但尚未指導(dǎo)芯片組對DDR6的支持。大多數(shù)硬件和云提供商都支持 CXL。

CXL 3.1 是一年多前推出的 CXL 3.0 的增量改進。CXL 協(xié)議是系統(tǒng)中芯片、內(nèi)存和存儲之間的通信鏈路。

CXL 3.0 規(guī)范基于 PCIe 6.0，數(shù)據(jù)傳輸速度高達每秒 64 千兆。它比其前身 CXL 2.0 快兩倍，CXL 2.0 基于 PCIe 5.0，并且正在進入服務(wù)器系統(tǒng)。

隨著 AI 等技術(shù)的普及，CXL 已成為芯片組的重要組成部分，機器學(xué)習(xí)應(yīng)用程序需要大量內(nèi)存和帶寬，CXL 允許跨服務(wù)器池化存儲和內(nèi)存。

CXL 3.1 協(xié)議可以打開更多的點對點通信，將內(nèi)存和存儲分解到單獨的機箱中，通過傳統(tǒng)網(wǎng)絡(luò)和互連技術(shù)進行分解的討論已經(jīng)討論了10年，CXL 提供了提供各種計算資源所需的可擴展性。

首先，CXL 3.1 規(guī)范提供了一個支持新型內(nèi)存的開放標(biāo)準(zhǔn)，可以更有效地將數(shù)據(jù)重新路由到內(nèi)存和加速器。

一項重要的改進是將結(jié)構(gòu)上的內(nèi)存資源匯集到一個全局地址下，該功能稱為全局集成內(nèi)存，對于在內(nèi)存和其它資源之間建立更快的連接非常重要。

加速器還將能夠直接與內(nèi)存資源通信，基于端口的路由的新功能有助于更快地訪問內(nèi)存資源。

CXL 3.1 還提供了在受保護環(huán)境中執(zhí)行數(shù)據(jù)的指令，引入這項技術(shù)是為了支持機密計算，英特爾的 Sapphire Rapids 中已經(jīng)引入了 TDX 指令，AMD的芯片中引入了 SNP-SEV 功能。

新規(guī)范定義了一種安全協(xié)議，該協(xié)議可保證數(shù)據(jù)在內(nèi)存、處理器和存儲之間移動時擴展安全環(huán)境。

該協(xié)議將檢測需要對連接進行身份驗證以打開硬件保險庫，以訪問代碼或信息的環(huán)境。這些信息可能位于處理器、內(nèi)存或存儲上。英特爾、Microsoft 和其它公司有不同類型的證明方法來驗證在安全環(huán)境中訪問數(shù)據(jù)的連接。

CXL的功能與特性詳解

CXL是一種用于加速CPU 和設(shè)備之間資料傳輸?shù)膮f(xié)定，主要應(yīng)用于人工智能和機器學(xué)習(xí)等領(lǐng)域，以解決在這些應(yīng)用中需要高效率的資料交互的需求。隨著PCIe協(xié)定的發(fā)展，到了5.0版本后，像需要大量IO 資料交互的人工智能應(yīng)用，開始遇到性能瓶頸的問題。為了突破這個瓶頸，引入了CXL協(xié)定的概念。

首先，CXL 協(xié)定解決了共享RAM的問題，在支援PCIe 協(xié)定的設(shè)備中，每個設(shè)備都擁有自己的RAM，但這些RAM無法被CPU 統(tǒng)一編址，因此無法直接進行調(diào)用，這導(dǎo)致了延遲的問題；CXL協(xié)定引入了共享RAM 的概念，允許CPU 對所有設(shè)備上的RAM 進行統(tǒng)一編址，從而實現(xiàn)了彼此之間的互相調(diào)用。

其次，CXL 協(xié)定解決了高延遲的問題，例如：CPU 和GPU之間的資料交互，需要經(jīng)過多個節(jié)點，包括CPU 緩沖（Cache）、CPU RAM、PCIe 鏈路、GPU RAM和GPU Cache 等，這些節(jié)點和IO 頻寬限制導(dǎo)致了延遲的增加；為了降低延遲，我們希望CPU 能夠直接存取GPU 的RAM，從而避免了繁復(fù)的資料傳輸過程。CXL的功能特性中，CXL 2.0 版本引入了FLIT（可變長度介面?zhèn)鬏敚現(xiàn)lexible-Length Interface Transport） based transfers 功能，使用544 位元的FLIT 模式進行資料傳輸，這種模式可以降低資料傳輸?shù)难舆t，類似于NVMe 協(xié)定中的隊列概念。

CXL的三個子協(xié)定及其對應(yīng)的三種設(shè)備

CXL有三個子協(xié)定：CXL.io、CXL.cache、CXL.memory。

CXL.io 和CXL.cache 是CXL 協(xié)定中的兩個子協(xié)定，它們的功能和用途有所不同，主要是為了引入非對稱的概念；CXL.io 類似于PCIe 的事件（event），主要用于初始化、鏈接、設(shè)備發(fā)現(xiàn)、列舉以及寄存器(register) 的存取，從某種程度上說，它可以看作是PCIe事件的一個變種。

CXL.cache 則是用于設(shè)備去使用主機的主要RAM，這表示設(shè)備可以直接存取主機的RAM，并且需要與CPU 的Cache 保持資料一致性；如果沒有有效的通訊和同步，可能會出現(xiàn)RAM 使用沖突或不存在的問題。

另一方面，CXL.memory則是CPU 使用設(shè)備上的RAM；在這種情況下，CPU可以直接存取設(shè)備上的RAM，而不需要與設(shè)備的Cache 進行交互；這是因為CPU 的Cache 直接使用設(shè)備上的RAM，因此可以直接進行通訊，而無需額外的同步操作。

總結(jié)來說，CXL.io 和CXL.cache 的使用方向和目的不同，因此被拆分為兩個子協(xié)定；CXL.io 類似于PCIe 事件，用于設(shè)備和主機之間的通訊和初始化過程；而CXL.cache 則用于設(shè)備存取主機的RAM 并保持資料一致性；另一方面，CXL.memory 則是CPU 直接使用設(shè)備上的RAM，無需與設(shè)備的Cache 進行交互，這樣的設(shè)計使得CXL 協(xié)定在不同的使用情境中更具靈活性和效能。

基于這三個子協(xié)定，衍生出三種不同的設(shè)備類型；其中，CXL.io 是所有設(shè)備都需要的協(xié)定，因為它包含了設(shè)備的列舉過程，使其能夠被識別和通信；另外兩個協(xié)定則是進行組合以產(chǎn)生更具特定功能的設(shè)備。

第一種設(shè)備類型是智慧網(wǎng)卡，它有Cache，但沒有獨立的RAM；相反，它直接使用CPU 的內(nèi)存，這使得在CPU 處理資料時非常迅速；由于記憶體就在設(shè)備內(nèi)部，它可以直接讀取和處理資料，這是它的優(yōu)勢。

第三種設(shè)備類型則只擁有RAM，而沒有Cache；換句話說，它實際上是CPU 的一種無限擴展的內(nèi)存；傳統(tǒng)CPU 主機板上的內(nèi)存插槽有限，且主機板的空間有限，即使提高單條內(nèi)存的容量也有限制。

審核編輯：黃飛

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴