英特爾的OCI(光學(xué)計(jì)算互連)芯粒有望革新面向AI基礎(chǔ)設(shè)施的高速數(shù)據(jù)處理。
英特爾在用于高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g(shù)上取得了突破性進(jìn)展。在2024年光纖通信大會(OFC)上,英特爾硅光集成解決方案(IPS)團(tuán)隊(duì)展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學(xué)計(jì)算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運(yùn)行真實(shí)數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用,英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)了光學(xué)I/O(輸入/輸出)共封裝,從而推動(dòng)了高帶寬互連技術(shù)創(chuàng)新。
服務(wù)器之間的數(shù)據(jù)傳輸正在不斷增加,當(dāng)今的數(shù)據(jù)中心基礎(chǔ)設(shè)施難堪重負(fù)。目前的解決方案正在迅速接近電氣I/O性能的實(shí)際極限。然而,借助英特爾的這項(xiàng)突破性進(jìn)展,客戶能夠?qū)⒐韫夤卜饣ミB方案無縫集成到下一代計(jì)算系統(tǒng)中。英特爾的OCI芯粒大大提高了帶寬、降低了功耗并延長了傳輸距離,有助于加速機(jī)器學(xué)習(xí)工作負(fù)載,進(jìn)而推動(dòng)高性能AI基礎(chǔ)設(shè)施創(chuàng)新。
——Thomas Liljeberg
英特爾硅光集成解決方案團(tuán)隊(duì)
該OCI芯粒可在最長可達(dá)100米的光纖上,單向支持64個(gè)32Gbps通道,有望滿足AI基礎(chǔ)設(shè)施日益增長的對更高帶寬、更低功耗和更長傳輸距離的需求。它將有助于實(shí)現(xiàn)可擴(kuò)展的CPU和GPU集群連接,和包括一致性內(nèi)存擴(kuò)展及資源解聚的新型計(jì)算架構(gòu)。
AI應(yīng)用正在全球范圍內(nèi)被越來越多地部署,近期大語言模型和生成式AI的發(fā)展正在加速這一趨勢。對AI負(fù)載加速新需求而言,更大、更高效的機(jī)器學(xué)習(xí)模型將發(fā)揮關(guān)鍵作用。未來的計(jì)算平臺需要面向AI實(shí)現(xiàn)擴(kuò)展,因而需要指數(shù)級提升的I/O帶寬和更長的傳輸距離,以支持更大規(guī)模的處理器(CPU、GPU和IPU)集群,和資源利用更高效的架構(gòu),如xPU解聚和內(nèi)存池化(memory pooling)。
電氣I/O(即銅跡線連接)帶寬密度高且功耗低,但傳輸距離短至不超一米。數(shù)據(jù)中心和早期AI集群中使用的可插拔光收發(fā)器模塊可以延長傳輸距離,但就AI工作負(fù)載的擴(kuò)展需求而言,其成本和功耗不可持續(xù)。xPU光電共封I/O解決方案可以在提高能效比、降低延遲和延長傳輸距離的同時(shí),支持更高的帶寬,從而滿足AI和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施的擴(kuò)展需求。
打個(gè)比方,在CPU和GPU中,用光學(xué)I/O取代電氣I/O進(jìn)行數(shù)據(jù)傳輸,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數(shù)量更大、距離更遠(yuǎn))。英特爾的OCI芯粒等光學(xué)I/O解決方案,在性能和能耗方面實(shí)現(xiàn)了這一水平的提升,從而有助于AI的擴(kuò)展。
英特爾OCI(光學(xué)計(jì)算互連)芯粒
在完全集成的OCI芯粒中,英特爾利用了已實(shí)際驗(yàn)證的硅光子技術(shù),集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。在2024年光纖通信大會上,英特爾展示了與自家CPU封裝在一起的OCI芯粒,但它也能與下一代CPU、GPU、IPU等SOC(系統(tǒng)級芯片)集成。
這一完全集成的OCI芯粒的雙向數(shù)據(jù)傳輸速度達(dá)4 Tbps,并兼容第五代PCIe。在2024年光纖通信大會現(xiàn)場,實(shí)時(shí)光學(xué)鏈路演示展示了通過單模光纖(SMF)跳線(patch cord)在兩個(gè)CPU平臺之間實(shí)現(xiàn)的發(fā)射器(Tx)和接收器(Rx)互連。CPU生成并測量了比特誤碼率(BER)。英特爾還展示了發(fā)射器的光譜(optical spectrum),包括單一光纖上200GHz間隔的八個(gè)波長,以及32Gbps發(fā)射器眼圖(eye diagram),表明信號質(zhì)量很強(qiáng)。
該芯粒目前單向支持64個(gè)32Gbps通道,傳輸距離達(dá)100米(由于傳輸延遲,實(shí)際應(yīng)用中距離可能僅限幾十米)。它采用8對光纖,每根8波長密集波分復(fù)用(DWDM)。這種共封裝解決方案也非常節(jié)能,功耗僅為每比特5皮焦耳(pJ),而可插拔光收發(fā)器模塊的功耗大約為每比特15皮焦耳。對數(shù)據(jù)中心和HPC環(huán)境而言,超高的能效十分重要,有助于解決AI應(yīng)用的高能耗問題,提高可持續(xù)性。
英特爾研究院在硅光子領(lǐng)域已深耕超過25年,是硅光集成的開拓者和領(lǐng)導(dǎo)者。英特爾在業(yè)內(nèi)率先開發(fā)并向大型云服務(wù)提供商批量交付硅光子連接器件,這些產(chǎn)品具有領(lǐng)先的可靠性。
英特爾的主要差異化優(yōu)勢在于其直接集成技術(shù),結(jié)合晶圓上激光器混合集成技術(shù),可提高良率并降低成本。這一獨(dú)特的方法使英特爾能夠在實(shí)現(xiàn)卓越性能的同時(shí)保持高能效比。依托強(qiáng)大的量產(chǎn)平臺,英特爾已出貨超過800萬個(gè)硅光子集成電路,包含多達(dá)3200萬個(gè)片上集成激光器,時(shí)基故障率(FIT)小于0.1。時(shí)基故障率是一種廣泛使用的測量可靠性的方法,體現(xiàn)了故障率和發(fā)生故障的次數(shù)。
這些硅光子集成電路被封裝在可插拔收發(fā)器模塊中,部署于超大規(guī)模云服務(wù)提供商的大型數(shù)據(jù)中心網(wǎng)絡(luò)中,用于傳輸速率需求高達(dá)100、200和400 Gbps的應(yīng)用。面向傳輸速率需求達(dá)800 Gbps和1.6 Tbps的新興應(yīng)用,速度達(dá)200G/通道的硅光子集成電路正在開發(fā)中。
英特爾還正在探索新的硅光子制造工藝節(jié)點(diǎn),該節(jié)點(diǎn)具有先進(jìn)的器件性能、更高的密度、更好的耦合性,并能大幅提高經(jīng)濟(jì)性。英特爾將繼續(xù)在片上激光器和性能、成本(芯片面積減少40%以上)和功耗(減少15%以上)等方面取得進(jìn)步。
英特爾研發(fā)的OCI芯粒目前尚處于技術(shù)原型(prototype)階段。英特爾正在與客戶合作,開發(fā)共封OCI和客戶SoC,作為光學(xué)I/O的解決方案。
英特爾的OCI芯粒推動(dòng)了高速數(shù)據(jù)傳輸技術(shù)的進(jìn)步。隨著AI基礎(chǔ)設(shè)施的不斷發(fā)展,英特爾將繼續(xù)推動(dòng)前沿技術(shù)創(chuàng)新,探索面向未來的連接技術(shù)。
英特爾公司,英特爾、英特爾logo及其它英特爾標(biāo)識,是英特爾公司或其分支機(jī)構(gòu)的商標(biāo)。文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。
審核編輯:彭菁
-
英特爾
+關(guān)注
關(guān)注
60文章
9861瀏覽量
171291 -
cpu
+關(guān)注
關(guān)注
68文章
10804瀏覽量
210834 -
數(shù)據(jù)傳輸
+關(guān)注
關(guān)注
9文章
1792瀏覽量
64411 -
封裝
+關(guān)注
關(guān)注
126文章
7728瀏覽量
142603 -
帶寬
+關(guān)注
關(guān)注
3文章
897瀏覽量
40796
原文標(biāo)題:英特爾實(shí)現(xiàn)光學(xué)I/O芯粒的完全集成
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論