0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

雙向4Tbps、兼容PCIe5.0!英特爾光學(xué)I/O chiplet再突破

Hobby觀察 ? 來源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-07-05 09:04 ? 次閱讀

數(shù)據(jù)中心高速傳輸是提升目前算力的重要技術(shù)之一,光通信已經(jīng)在數(shù)據(jù)中心內(nèi)部服務(wù)器互聯(lián)中廣泛應(yīng)用,而在更微觀的角度,光互連還能夠被應(yīng)用到主板上CPUGPU的互連,甚至是更小尺度下的片上互連。

在2024年光纖通信大會(huì)(OFC)上,英特爾集成光子解決方案(IPS)部門展示了業(yè)界首款完全集成的光學(xué)計(jì)算互連(OCI)chiplet芯粒,該芯粒與英特爾CPU封裝在一起,將過去通過銅線實(shí)現(xiàn)的電氣I/O接口傳輸數(shù)據(jù),變成采用光學(xué)I/O解決方案,實(shí)現(xiàn)了高帶寬片上互連的突破。

AI數(shù)據(jù)中心,需要更高帶寬的互連

隨著“百模大戰(zhàn)”的打響,目前市面上琳瑯滿目的AI大模型產(chǎn)品都需要大量的算力進(jìn)行支撐,包括模型研發(fā)階段的訓(xùn)練以及在實(shí)際落地中進(jìn)行的推理計(jì)算都需要海量算力。隨著AI模型變得越來越復(fù)雜,它們需要更多的計(jì)算資源和數(shù)據(jù)交換能力。高帶寬互連可以提供必要的數(shù)據(jù)吞吐量,以支持這些大型模型的訓(xùn)練和推理。

而目前數(shù)據(jù)中心算力提升主要包括兩部分,一是采用算力更高的計(jì)算卡,二是提高大規(guī)模數(shù)據(jù)中心服務(wù)器或CPU和GPU之間的帶寬,提高整體系統(tǒng)的效率,比如英偉達(dá)的NVLink、AMD/英特爾/谷歌/微軟等巨頭共同組建的UALink標(biāo)準(zhǔn)等。

而從更加微觀的角度來看,在算力芯片中,每個(gè)模塊或者說每個(gè)Die、chiplet模塊之間其實(shí)也需要進(jìn)行互連。以往芯片上都采用傳統(tǒng)的電互連,銅作為電傳輸信息的介質(zhì)。但畢竟銅是有電阻的,在高速數(shù)據(jù)傳輸過程中,發(fā)熱、損耗、功耗等都較高,相比之下,光傳輸損耗極低,且過程中不產(chǎn)生熱量,非常適合解決數(shù)據(jù)傳輸瓶頸問題。

在AI計(jì)算中,尤其是深度學(xué)習(xí)算法通常需要大量的并行計(jì)算,更高帶寬的互連能夠讓芯片上信息交換效率大大提升,從而實(shí)現(xiàn)更高效的并行處理。另外在chiplet封裝的趨勢下,多個(gè)模塊封裝在同一基板上集成為單顆SoC,更高速的片上互連則能加快這些芯粒之間的數(shù)據(jù)傳輸,從而提升計(jì)算能力。

從結(jié)構(gòu)上看,片上光互連其實(shí)是一種光子集成芯片技術(shù),將不同功能的有源器件和無源器件集成在同一塊光電基板上。光電基板上具有光子路由波導(dǎo),這些波導(dǎo)被用于數(shù)據(jù)通信,和用于電路走線的多層金屬層。CMOS電芯片堆疊在硅光芯片上,在光電基板上形成二維陣列。

光從基板上的激光光源中發(fā)出,輸入到基板上的路由波導(dǎo),通過波導(dǎo)到達(dá)光芯片上的調(diào)制器。這個(gè)時(shí)候電芯片上的信息數(shù)據(jù),通過電芯片和光芯片之間的微凸塊加載到環(huán)形調(diào)制器中,將數(shù)字1和0轉(zhuǎn)換為光的強(qiáng)度差異。

調(diào)制后的光信號通過光電基板上的波導(dǎo)傳播,到達(dá)其他光芯片上的光電探測器中。這個(gè)時(shí)候光信號就被轉(zhuǎn)換成電信號,這些信息就被不同的電芯片所接收。

當(dāng)然在實(shí)際應(yīng)用中,每個(gè)CMOS芯片和光芯片之間,都有數(shù)以千計(jì)的微凸塊被用于數(shù)據(jù)傳輸。因?yàn)楣庑盘杺鞑ゲ恍枰~導(dǎo)線,損耗小,延遲低,這樣就實(shí)現(xiàn)了在光電基板上進(jìn)行高能效、高帶寬密度、低延遲的光互連。

英特爾的集成OCI芯粒有哪些亮點(diǎn)?

據(jù)英特爾介紹,在OFC上展示的OCI芯粒集成了硅光子集成電路,包括片上激光器和光放大器、與電子集成電路。OCI芯粒除了在現(xiàn)場展示的與英特爾CPU封裝在一起外,還可以與下一代的CPU、GPU、IPUs以及其他SoC集成。

英特爾OCI支持高達(dá)4Tbps的雙向數(shù)據(jù)傳輸速率,與第五代PCIe兼容。在OFC現(xiàn)場光學(xué)鏈路演示展示了兩個(gè)CPU平臺之間通過單模光纖(SMF)跳線連接的發(fā)射機(jī)(Tx)和接收機(jī)(Rx)。CPU生成并測量了光比特錯(cuò)誤率(BER),演示展示了在單根光纖上8個(gè)波長、200GHz間隔的Tx光譜,以及一個(gè)32Gbps的Tx眼圖,展示了強(qiáng)大的信號質(zhì)量。

目前的OCI芯粒支持每個(gè)方向上64個(gè)通道的32Gbps數(shù)據(jù)傳輸,傳輸距離可達(dá)100米(盡管由于飛行時(shí)間延遲,實(shí)際應(yīng)用可能限制在幾十米以內(nèi)),使用八對光纖,每對攜帶八個(gè)密集波分復(fù)用(DWDM)波長。共封裝解決方案的能效也非常高,每比特僅消耗5pJ,相比之下,可插拔光收發(fā)模塊大約為15pJ/bit。這種超高效能水平對于數(shù)據(jù)中心和高性能計(jì)算環(huán)境至關(guān)重要,并且可能有助于解決人工智能不可持續(xù)的功率需求問題。

作為在硅光領(lǐng)域投入多年的半導(dǎo)體巨頭,英特爾的主要優(yōu)勢就是高度集成化,采用混合激光器晶圓上技術(shù)和直接集成,這帶來更高的可靠性和更低的成本。這種獨(dú)特的方法使英特爾能夠在保持效率的同時(shí)提供卓越的性能。英特爾強(qiáng)大、高容量的平臺已經(jīng)出貨超過800萬個(gè)光子集成電路(PICs),集成了超過3200萬個(gè)芯片級激光器,顯示出時(shí)間失效(FIT)率低于0.1,可靠性極高。

小結(jié):

除了英特爾之外,目前在片上光互連領(lǐng)域還有曦智科技、Ayar Labs等企業(yè)在投入研發(fā),并取得了一定成果。2023年Hot CHIPS會(huì)議上,曦智科技展示了其片上光互連技術(shù)上的最新進(jìn)展,該系統(tǒng)的通道數(shù)為512,單通道最長廣播距離為50mm,廣播延時(shí)1ns,單通道頻率4GHz,片上總帶寬達(dá)到2Tbps。可以預(yù)見,隨著數(shù)據(jù)中心算力需求的提高,片上光互連將會(huì)加快落地的進(jìn)程。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9748

    瀏覽量

    170644
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    404

    瀏覽量

    12513
  • PCIe5.0
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    1232
收藏 人收藏

    評論

    相關(guān)推薦

    英特爾OCI芯粒在新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)光學(xué)I/O(輸入/輸出)共封裝

    (IPS)團(tuán)隊(duì)展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學(xué)計(jì)算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運(yùn)行真實(shí)數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用,英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)了
    的頭像 發(fā)表于 06-29 11:47 ?641次閱讀

    英特爾實(shí)現(xiàn)光學(xué)I/O芯粒的完全集成

    在科技日新月異的今天,數(shù)據(jù)傳輸速度的提升已成為推動(dòng)各行業(yè)發(fā)展的關(guān)鍵因素。近日,英特爾在高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g(shù)上取得了令人矚目的突破,為數(shù)據(jù)中心和HPC(高性能計(jì)算)應(yīng)用帶來了革命性的變化。
    的頭像 發(fā)表于 06-29 09:27 ?426次閱讀

    英特爾推出集成光學(xué)計(jì)算互聯(lián)OCI Chiplet芯片

    在全球信息技術(shù)飛速發(fā)展的今天,數(shù)據(jù)傳輸速度和效率成為了決定科技競爭力的關(guān)鍵因素之一。英特爾,作為全球領(lǐng)先的半導(dǎo)體公司,始終站在技術(shù)革新的前沿。近日,英特爾宣布了一項(xiàng)具有劃時(shí)代意義的里程碑成果——集成光學(xué)計(jì)算互聯(lián)(OCI)
    的頭像 發(fā)表于 06-28 10:55 ?562次閱讀

    英特爾實(shí)現(xiàn)光學(xué)IO芯粒的完全集成

    (IPS)團(tuán)隊(duì)展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學(xué)計(jì)算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運(yùn)行真實(shí)數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用,英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)了
    的頭像 發(fā)表于 06-28 10:16 ?249次閱讀
    <b class='flag-5'>英特爾</b>實(shí)現(xiàn)<b class='flag-5'>光學(xué)</b>IO芯粒的完全集成

    AlmaLinux 9.4兼容棄用的RHEL硬件,包括英特爾Data Streaming設(shè)備

    AlmaLinux 9.4效仿 RHEL 9.4增強(qiáng)多項(xiàng)功能/特性,例如全力兼容英特爾Data Streaming Accelerator驅(qū)動(dòng)及英特爾SGX,同時(shí)以技術(shù)預(yù)覽方式支持NVMe over TCP,并為用戶提供Pyth
    的頭像 發(fā)表于 05-07 10:57 ?607次閱讀

    BittWare提供基于英特爾Agilex? 7 FPGA最新加速板

    BittWare 當(dāng)前的加速板產(chǎn)品組合包括最新的英特爾 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的頭像 發(fā)表于 04-30 15:22 ?681次閱讀
    BittWare提供基于<b class='flag-5'>英特爾</b>Agilex? 7 FPGA最新加速板

    英特爾Clearwater Forest系列突破高核心數(shù)服務(wù)器CPU

    在封裝方面,英特爾表示,對于Clearwater Forest,將使用其他工藝節(jié)點(diǎn)來實(shí)現(xiàn)SRAM和I/O,因?yàn)檫@些節(jié)點(diǎn)在較新的工藝上無法很好地?cái)U(kuò)展。
    發(fā)表于 03-01 14:30 ?403次閱讀

    光纖直接插入芯片,速度和效率驚人!

    TeraPHY是一款光學(xué)I/O小芯片,擁有4Tbps雙向帶寬,卻只有10W的功耗。這項(xiàng)技術(shù)的重要性在于,擺脫了傳統(tǒng)的PCB和長電氣走線的限
    的頭像 發(fā)表于 12-21 14:45 ?668次閱讀

    什么是PCIe?PCIe有什么用途?PCIe 5.0有何不同?

    隨著英特爾Alder Lake CPU的發(fā)布,以及AMD 7000 Ryzen CPU的即將發(fā)布,PCIe 5.0 硬件終于成為現(xiàn)實(shí)。但什么是 PCIe
    的頭像 發(fā)表于 11-18 16:48 ?2936次閱讀
    什么是<b class='flag-5'>PCIe</b>?<b class='flag-5'>PCIe</b>有什么用途?<b class='flag-5'>PCIe</b> <b class='flag-5'>5.0</b>有何不同?

    #高通 #英特爾 #Elite 高通X Elite芯片或終結(jié)蘋果、英特爾的芯片王朝

    高通英特爾蘋果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07

    英特爾發(fā)布面向發(fā)燒友的英特爾酷睿第14代臺式機(jī)處理器

    ,由于比前一代增加了4個(gè)能效核,i7-14700K擁有20核心和28線程。英特爾Extreme Tuning Utility新增了AI Assist功能,為特定的未鎖頻臺式機(jī)處理器帶來AI引導(dǎo)的一鍵超頻功能 1 。 “ 自推出高
    的頭像 發(fā)表于 10-21 16:40 ?691次閱讀

    新思科技成功實(shí)現(xiàn)與英特爾PCIe 6.0測試芯片的互操作性

    新思科技PCIe 6.0 IP與英特爾 PCIe 6.0測試芯片實(shí)現(xiàn)互操作 在64GT/s 高速連接下成功驗(yàn)證互操作性,降低高性能計(jì)算SoC的集成風(fēng)險(xiǎn) 新思科技近日宣布,新思科技PCI
    的頭像 發(fā)表于 10-16 09:22 ?698次閱讀

    新思科技PCIe 6.0 IP與英特爾PCIe 6.0測試芯片實(shí)現(xiàn)互操作

    :SNPS)近日宣布,新思科技PCI Express(PCIe)6.0 IP在端到端64GT/s的連接下,成功實(shí)現(xiàn)與英特爾PCIe 6.0測試芯片的互操作性。這一全新里程碑也將保證,在未來無論是集成
    發(fā)表于 10-12 15:11 ?271次閱讀

    臺積電、英特爾攜手推出全球首款小芯片互聯(lián)

    技)UCIe IP的兩個(gè)小芯片,透過英特爾EMIB先進(jìn)封裝進(jìn)行連接。 隨著科技不斷進(jìn)步,芯片技術(shù)日新月異,英特爾在創(chuàng)新日上向全球展示了一項(xiàng)令人矚目的突破。這項(xiàng)突破是世界上第一個(gè)采用UC
    的頭像 發(fā)表于 09-22 18:17 ?619次閱讀

    英特爾發(fā)布全球首款基于UCIe連接的Chiplet(小芯片)處理器

    英特爾基于Chiplet的處理器,如Sapphire Rapids和新發(fā)布的Meteor Lake,目前使用專有接口和協(xié)議進(jìn)行Chiplet之間的通信,但英特爾已宣布將在其下一代Arr
    發(fā)表于 09-22 16:05 ?617次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布全球首款基于UCIe連接的<b class='flag-5'>Chiplet</b>(小芯片)處理器