久久免费视频播放平台,一级特黄aa大片爽爽影院免费

9月14-15日，2023全球AI 芯片峰會（GACS 2023）在深圳正式舉行?？究萍紤?yīng)邀出席大會，副總裁王曉陽發(fā)表主題為《驅(qū)動云/邊緣側(cè)算力建設(shè)的高性能互聯(lián)接口方案》的演講。在演講中，王曉陽分享了AIGC產(chǎn)業(yè)算力需求引發(fā)的芯片互聯(lián)趨勢，并對算力芯片瓶頸進行了分析，提出了奎芯內(nèi)存互聯(lián)解決方案和Chiplet方案落地案例。

AIGC引爆的芯片互聯(lián)趨勢

最近幾年AI模型快速發(fā)展，模型規(guī)模每年差不多10倍速度增長，當令人驚訝的1750億參數(shù)的GPT3已成為過去式，迎來更大體量的萬億參數(shù)時代，AI系統(tǒng)算力需求也隨之增加，幾乎每季度翻倍增長。最近幾年體系結(jié)構(gòu)討論最多的問題之一就是如何破解兩堵墻：內(nèi)存墻和I/O墻。多年來通過工藝進步，計算架構(gòu)設(shè)計革新等方法，理論算力的增長速度是驚人的，但是內(nèi)存帶寬，互聯(lián)帶寬的增長卻相對緩慢，造成了巨大的落差，最近業(yè)界也在嘗試很多方法來縮小這些差距比如：增加緩存，多級緩存架構(gòu)，堆疊緩存；盡量提高單節(jié)點算力減少互聯(lián)的overhead；用高速的芯片互聯(lián)和系統(tǒng)互聯(lián)的SerDes做芯片互聯(lián)等等。

英偉達GH200非常重點的強調(diào)HBM帶寬，LPDDR容量，以及NVLINK的速度。AMD發(fā)布的MI300X對算力指標提都不提，只提內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬。因此可以看到在LLM的游戲規(guī)則下，內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬成了最核心的競爭力，而算力的重要性相對下降。

算力芯片瓶頸分析

目前主流AI大芯片采用HBM為主，它的價格相對其他內(nèi)存要貴，但單位帶寬成本較低。

HBM使用有諸多限制，其一是因為HBM的顆粒必須和SOC的Die要對齊，合封在一起，所以它是一個緊耦合的狀態(tài)，會帶來如下限制：在HBM數(shù)量方面，SoC與HBM必須保持貼合，導(dǎo)致HBM顆粒數(shù)量受限于芯片邊緣長度；在熱管理方面，DRAM的溫度敏感性會限制SoC的工作頻率，從而影響性能，而SoC與HBM之間的熱交互對測試提出了更高的要求；在設(shè)計實施方面，HBM IP的布局和適配性相對不夠靈活；另外，工藝限制要求SoC與HBM HOST IP必須采用相同的工藝制程；最后，需要注意的是SoC的面積占用問題，在12納米工藝下每個HBM HOST IP大約占據(jù)30mm2，限制了計算單元的面積。

其二是主流HBM的應(yīng)用還是以先進封裝為主，包括Silicon interposer 或者Silicon Bridge等，也帶來了不少限制：Interposer尺寸受限制，最大只能有3到4個曝光面積；2.5D封裝的成本較高，與標準封裝相比價格高出4倍，近期臺積電的CoWoS單價上漲了20%；采用uBump作為連接點時，測試覆蓋率有限，當封裝中包含超過6個HBM和2個ASIC時，良率明顯下降；最后，CoWoS產(chǎn)能有限，臺積電的CoWoS產(chǎn)能緊缺，國內(nèi)2.5D封裝技術(shù)還不夠成熟。

奎芯基于UCIe接口的HBM互聯(lián)方案

針對這些問題，奎芯科技打造一站式解決方案—M2LINK，用于將HBM和SoC解耦?；咀龇ㄊ抢靡活wChiplet將HBM接口協(xié)議轉(zhuǎn)成UCIE接口協(xié)議，然后用RDL interposer 把Chiplet和HBM內(nèi)存封裝成一個標準模組，最后通過普通基板來和主SoC進行封裝。這樣主SoC和標準模組間距離預(yù)計可以拉遠到2.5cm，克服了原先主SoC和HBM緊耦合和綁定的限制，同時也無需受限于先進封裝的高成本和Si Interposer的有限尺寸。除此之外還有諸多好處，比如以UCIe IP取代HBM IP，節(jié)省了主芯片面積，主芯片成本降低；單位邊長可以連接更多的HBM標準模組，內(nèi)存容量和帶寬都可以得到提升等等。

以目前主流芯片為例，SoC近HBM的邊長為30mm的話，可以擺放6個HBM顆粒，利用M2LINK方案的話，雙邊共可以擺放8個HBM模組，同等大小的SoC可利用面積增大44%，內(nèi)存容量帶寬增加1/3, 最大封裝面積可以增加一倍以上。

奎芯Chiplet落地解決方案

奎芯科技作為國內(nèi)領(lǐng)先的互聯(lián)IP產(chǎn)品及Chiplet產(chǎn)品供應(yīng)商，國產(chǎn)自研內(nèi)存及互聯(lián)解決方案，奎芯LPDDR5X接口速率可達8533Mbps，業(yè)界領(lǐng)先。奎芯D2D接口則具有高速率、低功耗、低延遲等優(yōu)勢。而奎芯HBM接口可支持國產(chǎn)工藝 PHY+ Controller 全套方案，速率可達6.4Gbps。目前，奎芯已經(jīng)有70件知識產(chǎn)權(quán)申請，以及16件榮譽獎項。

奎芯科技基于對于整個封裝供應(yīng)鏈的整合能力，目前和客戶一起打造一款標準的帶HBM3的2.5D全國產(chǎn)封裝大芯片，將會提供包含HBM IP, interposer設(shè)計，2.5D封裝的設(shè)計的完整的turn key solution。

同時，奎芯科技基于D2D（UCIe）解耦SoC和HBM HOST的思路不僅適用于云端訓練和推理的大算力芯片，在端側(cè)已經(jīng)有具體實踐的案例，目前在給客戶打造的是一款低功耗計算產(chǎn)品的IO die。對于此場景，客戶希望計算部分用最先進的制程，考慮到昂貴的成本，客戶還是希望解耦內(nèi)存接口放到成熟工藝上實現(xiàn)，因此我們給客戶打造一顆包含 LPDDR host 的完整IO die, 實現(xiàn)內(nèi)存接口解耦，降低成本，為客戶未來產(chǎn)品升級增加靈活性。

奎芯科技致力于建立開放生態(tài)的一站式Chiplet服務(wù)平臺，提供接口IP，Chiplet，系統(tǒng)設(shè)計和先進封裝設(shè)計等服務(wù)，配套強大的供應(yīng)鏈資源及高效的系統(tǒng)整合服務(wù)，為客戶提供完整的一站式解決方案。

來源：奎芯科技

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

芯片

芯片

+關(guān)注

關(guān)注
450

文章
49622

瀏覽量
417091
AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
1828

瀏覽量
34661
算力

算力

+關(guān)注

關(guān)注
1

文章
833

瀏覽量
14567
chiplet

chiplet

+關(guān)注

關(guān)注
6

文章
404

瀏覽量
12513

【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

范圍內(nèi)，對于推動科技進步、經(jīng)濟發(fā)展及社會整體的運作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展，高性能計算（HPC）和人工智能（AI）等技術(shù)在多個領(lǐng)域的應(yīng)用變得日益廣泛，芯片算力成為支持這些技術(shù)

發(fā)表于 09-02 10:09

廣和通端側(cè)AI解決方案驅(qū)動性能密集型場景商用型場景商用

2024世界機器人大會期間，廣和通宣布：基于高通QCS8550平臺的廣和通端側(cè)AI解決方案高效使能性能密集型場景。該端側(cè)AI解決方案整合強大

發(fā)表于 08-23 16:06 ?165次閱讀

廣和通端側(cè)AI解決方案驅(qū)動性能密集型場景商用型場景商用

2024世界機器人大會期間，廣和通宣布：基于高通QCS8550平臺的廣和通端側(cè)AI解決方案高效使能性能密集型場景。該端側(cè)AI解決方案整合強大

發(fā)表于 08-23 16:05 ?502次閱讀

廣和通端<b class='flag-5'>側(cè)</b>AI解決<b class='flag-5'>方案</b><b class='flag-5'>驅(qū)動</b><b class='flag-5'>性能</b>密集型場景商用型場景商用

【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu)：大模型算力中心建設(shè)指南

書籍介紹大模型是近年來引人注目的熱點之一。大模型蓬勃發(fā)展的基礎(chǔ)，是針對其需求設(shè)計的算力及基礎(chǔ)架構(gòu)。本書針對如何為大模型構(gòu)建基礎(chǔ)架構(gòu)進行深入講解，并基于TOGAF方法論，剖析業(yè)界知名案例的設(shè)計方案

發(fā)表于 08-16 18:33

如何理解云計算？

和硬件資源。在數(shù)字化時代，互聯(lián)網(wǎng)已經(jīng)成為基礎(chǔ)設(shè)施。云計算使得數(shù)據(jù)中心能夠像一臺計算機一樣去工作。通過互聯(lián)網(wǎng)將算力以按需使用、按量付費的形式

發(fā)表于 08-16 17:02

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

、VMware、Palo Alto 等公司紛紛推出相關(guān)解決方案。這些方案背后共同的本質(zhì)思想是：將云計算的 IaaS 層組件從服務(wù)器側(cè)卸載后圍繞 DPU 構(gòu)筑

發(fā)表于 07-24 15:32

曙光攜手“算力互聯(lián)公共服務(wù)平臺”提高全國算力匹配效率

近日，由中國信息通信研究院開發(fā)的“算力互聯(lián)公共服務(wù)平臺”在重慶上線。作為該平臺合作方之一，曙光智算參與了平臺發(fā)布儀式。 ? ? 曙光將依托在算

發(fā)表于 07-16 15:45 ?497次閱讀

中科馭數(shù)成為首批算力互聯(lián)互通研究組成員單位

? ?5月25日，在由中國信通院牽頭召開的算力互聯(lián)互通研究組成立大會上，中科馭數(shù)作為首批成員單位受邀出席啟動儀式，共話算力產(chǎn)業(yè)發(fā)展實踐。 ▲

發(fā)表于 05-30 19:08 ?631次閱讀

中貝通信與安聯(lián)通簽訂高性能算力服務(wù)合同

近日，中貝通信發(fā)布公告，宣布與北京安聯(lián)通科技有限公司正式簽訂了《算力技術(shù)服務(wù)合同》及相應(yīng)的《服務(wù)訂單》。根據(jù)合同內(nèi)容，中貝通信將針對安聯(lián)通的高性能算

發(fā)表于 05-29 09:13 ?615次閱讀

《北京市算力基礎(chǔ)設(shè)施建設(shè)實施方案（2024—2027年）》正式印發(fā)

《北京市算力基礎(chǔ)設(shè)施建設(shè)實施方案（2024—2027年）》正式印發(fā)

發(fā)表于 05-17 08:36 ?393次閱讀

深度踐行“IaaS on DPU”理念，中科馭數(shù)正式發(fā)布“馭云”高性能云異構(gòu)算力解決方案！

?高性能云異構(gòu)算力解決方案，為企業(yè)提供更快部署、更強性能和更高吞吐的

發(fā)表于 05-14 17:04 ?352次閱讀

算力中心：數(shù)字經(jīng)濟發(fā)展的新引擎

、建設(shè)與發(fā)展，并分析其對數(shù)字經(jīng)濟發(fā)展的影響。01、算力中心的定義與概述算力中心是指具備高性能計算

發(fā)表于 04-13 08:27 ?1146次閱讀

瀚博半導(dǎo)體與海馬云達成戰(zhàn)略合作，共建GPU高性能算力服務(wù)集群

近日，瀚博半導(dǎo)體與國內(nèi)領(lǐng)先的實時云渲染平臺服務(wù)提供商海馬云達成戰(zhàn)略合作，雙方將共同建設(shè)千片規(guī)模以上的GPU高性能算

發(fā)表于 04-10 09:21 ?652次閱讀

明天線上見！DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布！

技術(shù)在不同行業(yè)中的應(yīng)用解決方案有哪些？能帶來怎樣的業(yè)務(wù)效果？ 3月29日本周五，中科馭數(shù)集結(jié)產(chǎn)品大咖及解決方案專家團，誠邀您參加以“DPU構(gòu)建高性能云

發(fā)表于 04-03 18:12 ?903次閱讀

EASY-EAI攜手Hailo推出高性能、高算力的邊緣AI硬件組合

EASY-EAI與Hailo建立合作關(guān)系，共同推出高算力的邊緣AI產(chǎn)品組合。

發(fā)表于 02-21 09:56 ?625次閱讀