久久久高清日本道免费观看,日本片在线看的免费网站

編者按

Chiplet標(biāo)準(zhǔn)UCIe已經(jīng)得到很多主流大廠的認(rèn)可，席卷之勢愈發(fā)明顯。但就Chiplet的價(jià)值挖掘，目前可見的，都還停留在如何降成本和簡單地?cái)U(kuò)大設(shè)計(jì)規(guī)模方面。我們覺得，Chiplet的價(jià)值還沒有得到充分挖掘。 Chiplet帶來的價(jià)值，不應(yīng)該是線性增長，而應(yīng)該是指數(shù)增長：

一方面，量變會(huì)引起質(zhì)變，Chiplet的流行，快速增加的單芯片設(shè)計(jì)規(guī)模，會(huì)給系統(tǒng)架構(gòu)創(chuàng)新提供更大的發(fā)揮空間，使得計(jì)算的架構(gòu)，從異構(gòu)走向超異構(gòu)。

另一方面，超異構(gòu)帶來的算力指數(shù)級提升，使得Chiplet的價(jià)值得到更加充分的發(fā)揮，反過來會(huì)促進(jìn)Chiplet的大范圍流行。

1 背景知識

1.1 單DIE性能和成本

單DIE的性能和成本，是正相關(guān)的關(guān)系。通常的芯片DIE設(shè)計(jì)，一定是在保證系統(tǒng)所需性能的條件下，選擇最合適的工藝，達(dá)到最合適的面積（成本），達(dá)到在性能約束條件下的性能成本比最優(yōu)。或者說：

在系統(tǒng)性能成本最優(yōu)的狀態(tài)下，受邊際效應(yīng)影響，想再想增加單DIE性能，所需要付出的成本代價(jià)非常高，會(huì)顯著影響性價(jià)比。

在系統(tǒng)性能成本最優(yōu)的狀態(tài)下，想要再優(yōu)化單DIE成本，可能會(huì)引起性能的大比例下降，反而不是性價(jià)比最優(yōu)。

1.2 Chiplet協(xié)議UCIe

英特爾、AMD、ARM、高通、三星、臺積電、日月光等大廠，以及Google Cloud、Meta、微軟于2022年3月2日宣布了一項(xiàng)新技術(shù)標(biāo)準(zhǔn)UCIe（Universal Chiplet Interconnect Express）。UCIe是一個(gè)開放的行業(yè)互連標(biāo)準(zhǔn)，可以實(shí)現(xiàn)小芯片之間的封裝級互連，具有高帶寬、低延遲、經(jīng)濟(jì)節(jié)能的優(yōu)點(diǎn)。 UCIe能夠滿足幾乎所有計(jì)算領(lǐng)域，包括云端、邊緣端、企業(yè)、5G、汽車、高性能計(jì)算和移動(dòng)設(shè)備等，對算力、內(nèi)存、存儲(chǔ)和互連不斷增長的需求。UCIe 具有封裝集成不同Die的能力，這些Die可以來自不同的晶圓廠、采用不同的設(shè)計(jì)和封裝方式。

UCIe白皮書中給出的Chiplets封裝集成的價(jià)值：

首先是面積的影響。為了滿足不斷增長的性能需求，芯片面積增加，有些設(shè)計(jì)甚至?xí)鲅谀０婷娣e的限制。即使不超過面積限制，改用多個(gè)小芯片也更有利于提升良率。另外，多個(gè)相同Die的集成封裝能夠適用于更大規(guī)模的場景。

另一個(gè)價(jià)值體現(xiàn)在降低成本。例如，處理器核心可以采用先進(jìn)的工藝，用更高的成本換取極致的性能，而內(nèi)存和I/O控制器則可以復(fù)用非先進(jìn)工藝。隨著工藝節(jié)點(diǎn)的進(jìn)步，成本增長非常迅速。若采用多Die集成模式，有些Die的功能不變，我們不必對其采用先進(jìn)工藝，可在節(jié)省成本的同時(shí)快速搶占市場。Chiplet封裝集成模式還可以使用戶能夠自主選擇Die的數(shù)量和類型。例如，用戶可以根據(jù)需求挑選任意數(shù)量的計(jì)算、內(nèi)存和I/O Die，并無需進(jìn)行Die的定制設(shè)計(jì)，可降低產(chǎn)品的SKU成本。

允許廠商能夠以快速且經(jīng)濟(jì)的方式提供定制解決方案。如圖1所示，不同的應(yīng)用場景可能需要不同的計(jì)算加速能力，但可以使用同一種核心、內(nèi)存和I/O。Chiplet方式允許廠商根據(jù)功能需求對不同的功能單元應(yīng)用不同的工藝節(jié)點(diǎn)，并實(shí)現(xiàn)共同封裝。相比板級互連，封裝級互連具有線長更短、布線更緊密的優(yōu)點(diǎn)。

1.3 超異構(gòu)計(jì)算

系統(tǒng)變得越來越龐大，系統(tǒng)可以分解成很多個(gè)子系統(tǒng)，子系統(tǒng)的規(guī)模已經(jīng)達(dá)到傳統(tǒng)單系統(tǒng)的規(guī)模。因此，都升級一下：系統(tǒng)變成了宏系統(tǒng)，子系統(tǒng)變成了系統(tǒng)。系統(tǒng)足夠龐大，場景綜合，單類型架構(gòu)無法包打天下：

CPU靈活性最好，但性能較差；

DSA性能很好，但靈活性差；

GPU介于兩者之間，可以說能較好的平衡性能和靈活性，也可以說，性能和靈活性都不夠極致。

規(guī)模龐大的復(fù)雜系統(tǒng)存在很多硬件加速的空間：

復(fù)雜系統(tǒng)最核心的一個(gè)特征是二八定律。用戶只關(guān)心自己的應(yīng)用，而應(yīng)用通常只占系統(tǒng)的20%，另外80%用戶不關(guān)心的也相對確定的部分，一般稱為基礎(chǔ)設(shè)施，這些是可以通過硬件加速來優(yōu)化性能的。

系統(tǒng)是逐步發(fā)展和沉淀的。很多原本屬于應(yīng)用層的工作任務(wù)，隨著時(shí)間推移，越來越成熟，逐漸地沉淀成了基礎(chǔ)設(shè)施。這些沉淀的工作任務(wù)可以通過硬件加速來優(yōu)化性能。最典型的場景是AI推理，現(xiàn)在已經(jīng)成為了基礎(chǔ)的服務(wù)，供不同的應(yīng)用調(diào)用。

在云計(jì)算、邊緣計(jì)算等形式的綜合計(jì)算模式下，單個(gè)用戶應(yīng)用的規(guī)?？赡懿淮螅?yàn)樵朴?jì)算的超大規(guī)模和多租戶，很多相似的用戶應(yīng)用其總和規(guī)模足夠龐大，因此，也可以通過GPU、FPGA或?qū)Ｓ眯酒姆绞竭M(jìn)行加速優(yōu)化。

那么，要做的就是揚(yáng)長避短，把不同類型的處理引擎協(xié)作起來，把各種引擎的優(yōu)勢充分利用起來，形成超異構(gòu)計(jì)算架構(gòu)：

DSA負(fù)責(zé)相對確定的大計(jì)算量的工作；

GPU負(fù)責(zé)應(yīng)用層有一些性能敏感的并且有一定彈性的工作；

CPU啥都能干，負(fù)責(zé)兜底。

于是整個(gè)系統(tǒng)架構(gòu)就變成了超異構(gòu)架構(gòu)。

總結(jié)一下計(jì)算架構(gòu)發(fā)展的四個(gè)階段：

第一階段，單CPU串行計(jì)算；

第二極端，多核CPU的并行計(jì)算；

第三階段，CPU+xPU的異構(gòu)計(jì)算；

第四階段，CPU+GPU+DSA+etc.的超異構(gòu)計(jì)算。

2 Chiplet技術(shù)方案

2.1 方案1：設(shè)計(jì)規(guī)模不變，優(yōu)化單DIE面積和良率等

一般情況下，在同等工藝同等功耗技術(shù)下，我們可以簡單地認(rèn)為，面積和成本成正比的。Chiplet實(shí)現(xiàn)用面積更小的DIE，實(shí)現(xiàn)同等規(guī)模設(shè)計(jì)，其優(yōu)勢主要為：

單DIE面積變小，增加芯片良率。而通常，單DIE的面積是已經(jīng)平衡好良率的情況下的，再減小面積優(yōu)化良率，可能效果并不是很明顯。并且，多DIE封裝會(huì)帶來額外的良率風(fēng)險(xiǎn)。這樣，一里一外的問題，通過多DIE來優(yōu)化良率的效果可能就不會(huì)很明顯。

可以讓一些DIE不采用先進(jìn)工藝，通過較低一些的工藝降低成本。

在不改變性能的條件下，通過Chiplet封裝可以降低成本；也可以反過來說，在同樣成本條件下，通過Chiplet封裝可以提升性能。

2.2 方案2：單DIE設(shè)計(jì)規(guī)模不變，多DIE集成

當(dāng)我們確定好單個(gè)DIE的性能和面積（功耗）的時(shí)候，這個(gè)時(shí)候相當(dāng)于是把工藝的價(jià)值挖掘到了最優(yōu)。需要Chiplet的價(jià)值，也同樣需要工藝的價(jià)值，都不能少。我們要做的是在工藝價(jià)值的基礎(chǔ)上，再疊加Chiplet封裝的價(jià)值。而不是如方案1一樣，為了Chiplet而Chiplet，反而放棄工藝的價(jià)值。因此，我們可以在原有DIE的基礎(chǔ)上，通過多DIE封裝來立竿見影地提升性能。

2.3 方案3：多DIE集成設(shè)計(jì)規(guī)模倍增，并且重構(gòu)系統(tǒng)

通常，CPU組成的芯片，性能不夠；而GPU、DSA組成的芯片無法單獨(dú)工作，需要外掛CPU，形成CPU+XPU的異構(gòu)計(jì)算架構(gòu)；而SOC本質(zhì)上是CPU+xPU的多個(gè)異構(gòu)系統(tǒng)的集成。異構(gòu)計(jì)算和SOC，本質(zhì)上都是以CPU為中心的系統(tǒng)，XPU是一個(gè)個(gè)孤島，所有的事情都需要CPU的參與才能把這些處理引串起來。超異構(gòu)完全打破不同處理引擎之間的界限，CPU和其他XPU同樣的地位，XPU間可以非常充分的交互，達(dá)到系統(tǒng)充分的整合。超異構(gòu)計(jì)算可以做到：

性能和靈活性兼顧。因?yàn)槎硕傻木壒?，絕大部分計(jì)算是在DSA級別的處理引擎中完成，所以性能效率很好。而用戶關(guān)心的應(yīng)用依然是在CPU級別的處理引擎完成，又兼顧了靈活可編程性。

因?yàn)槌悩?gòu)計(jì)算架構(gòu)可以駕馭更大的系統(tǒng)，因此，可以做到，在性能效率和DSA同量級的情況下，性能相比DSA再數(shù)量級的提升。

2.4 方案性能提升對比

注意：本節(jié)內(nèi)容是定性分析，還無法做到定量分析。方案1，可以實(shí)現(xiàn)性能的百分比增長。方案1的道理很好理解，本來的目標(biāo)是優(yōu)化成本，在同等性能情況下，能夠百分比地優(yōu)化成本。我們相應(yīng)地折算一下，在同等成本下，方案1可以做到性能的百分比提升。方案2，可以實(shí)現(xiàn)性能的線性增長。方案2也很好理解，通過增加更多數(shù)量的DIE來提升并行度，以此來提升性能。集成多少個(gè)DIE，性能就增加到多少倍。方案3，可以實(shí)現(xiàn)性能的指數(shù)增長。方案3通過整個(gè)系統(tǒng)重構(gòu)，挖掘系統(tǒng)的一些可加速的點(diǎn)，然后再實(shí)現(xiàn)整個(gè)系統(tǒng)的充分整合重構(gòu)。以此來提升性能?？梢赃_(dá)到數(shù)量級的性能增長。

3 總結(jié)

3.1 設(shè)計(jì)規(guī)模的量變，引起系統(tǒng)架構(gòu)的質(zhì)變

規(guī)模是一個(gè)很重要的因素。云計(jì)算百萬臺的超大規(guī)模，其軟硬件架構(gòu)和運(yùn)營模式跟傳統(tǒng)的數(shù)百臺的私有機(jī)房是完全迥異的。深度神經(jīng)網(wǎng)絡(luò)，通過更大量數(shù)據(jù)、更深層次網(wǎng)絡(luò)的量變，成就了AI的“智”變。芯片也是同樣的道理，隨著規(guī)模的增長，很多設(shè)計(jì)方案考慮的問題會(huì)跟以前完全不一樣。在小規(guī)模的時(shí)候，我們強(qiáng)調(diào)定制，極度優(yōu)化性能和功耗等；但等到超大規(guī)模IC設(shè)計(jì)，我們更多關(guān)注的是通用性、可編程性、易用性、生態(tài)等。 Chiplet機(jī)制，提供了立竿見影讓芯片設(shè)計(jì)規(guī)模數(shù)量級增加的能力。如果我們不在系統(tǒng)架構(gòu)層次創(chuàng)新，充分利用芯片規(guī)模數(shù)量級增加的這個(gè)優(yōu)勢，只是簡單的平行擴(kuò)展，那真是暴殄天物，浪費(fèi)Chiplet給系統(tǒng)架構(gòu)師們的饋贈(zèng)。換個(gè)角度，現(xiàn)有的異構(gòu)計(jì)算也好，SOC也好，無法駕馭Chiplet提供的超大規(guī)模芯片系統(tǒng)。需要本質(zhì)的、體系性的系統(tǒng)架構(gòu)創(chuàng)新，來更好地駕馭Chiplet的價(jià)值。

3.2 超異構(gòu)，讓Chiplet價(jià)值得到更大的發(fā)揮

超異構(gòu)集成更多的處理引擎，提供更高的并行性，實(shí)現(xiàn)更分布式的系統(tǒng)，可以更好地駕馭數(shù)量級增加的芯片設(shè)計(jì)規(guī)模。此外，Chiplet更好地容納現(xiàn)有宏系統(tǒng)的承載，通過超異構(gòu)，使得很多性能優(yōu)化措施得到落實(shí)，從而使得性能指數(shù)級增長（而不是根據(jù)面積的增加，線性增長）。可以說，超異構(gòu)，成就了Chiplet更大的價(jià)值，使得Chiplet方案得到更大范圍的落地，促進(jìn)Chiplet技術(shù)的成熟和市場繁榮。

3.3 Chiplet和超異構(gòu)的關(guān)系：雙劍合璧，相互成就

超異構(gòu)計(jì)算和Chiplet技術(shù)是相互協(xié)同、相互成就的關(guān)系：

系統(tǒng)越大，設(shè)計(jì)規(guī)模越大，超異構(gòu)的性能優(yōu)勢就越明顯。

超異構(gòu)計(jì)算，需要數(shù)量級提升的晶體管資源，而Chiplet可以在芯片層次提供如此規(guī)模的晶體管資源，實(shí)現(xiàn)超異構(gòu)計(jì)算方案和價(jià)值落地。

超異構(gòu)計(jì)算的價(jià)值得到充分體現(xiàn)，超異構(gòu)不斷落地，會(huì)帶動(dòng)Chiplet的價(jià)值發(fā)揮、更廣泛的落地以及市場繁榮。

隨著超異構(gòu)的發(fā)展，對Chiplet的要求會(huì)不斷提高，需要Chiplet技術(shù)向更高的能力邁進(jìn)。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

單芯片

單芯片

+關(guān)注

關(guān)注
3

文章
410

瀏覽量
34478
chiplet

chiplet

+關(guān)注

關(guān)注
6

文章
405

瀏覽量
12513
UCIe

UCIe

+關(guān)注

關(guān)注
0

文章
42

瀏覽量
1596

原文標(biāo)題：超異構(gòu) x Chiplet：雙劍合璧，實(shí)現(xiàn)算力指數(shù)級提升

文章出處：【微信號：IP與SoC設(shè)計(jì)，微信公眾號：IP與SoC設(shè)計(jì)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

中國智能汽車騰飛，為什么異構(gòu)算力是第一生產(chǎn)力？

智能時(shí)代的“世紀(jì)之車”，異構(gòu)算力是第一驅(qū)動(dòng)力

發(fā)表于 09-14 10:32 ?2658次閱讀

中國智能汽車騰飛，為什么<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產(chǎn)<b class='flag-5'>力</b>？

算力的分類與現(xiàn)代生活

力的提升使得用戶能夠享受到更加流暢和豐富的數(shù)字體驗(yàn)。個(gè)人算力通常指的是個(gè)人使用的計(jì)算設(shè)備，如智

發(fā)表于 08-26 15:05 ?101次閱讀

<b class='flag-5'>算</b><b class='flag-5'>力</b>的分類與現(xiàn)代生活

安謀科技異構(gòu)算力組合，破局生成式AI算力挑戰(zhàn)

，“此芯P1”不僅異構(gòu)集成了Armv9 CPU核心與Arm Immortalis GPU，還搭載了安謀科技（中國）有限公司（以下簡稱“安謀科技”）“周易”NPU等自研業(yè)務(wù)產(chǎn)品。憑借高能效的異構(gòu)算

發(fā)表于 08-13 09:12 ?424次閱讀

神州鯤泰亮相北京數(shù)字安全大會(huì)，以智能算力構(gòu)筑數(shù)據(jù)安全的堅(jiān)實(shí)底座

算力正成為賦能各行各業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)技術(shù)要素，神州鯤泰面對智算時(shí)代多云、異構(gòu)、綠色計(jì)算等現(xiàn)實(shí)需求，智算集群間以及集群內(nèi)復(fù)雜

發(fā)表于 07-18 16:06 ?327次閱讀

神州鯤泰亮相北京數(shù)字安全大會(huì)，以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>構(gòu)筑數(shù)據(jù)安全的堅(jiān)實(shí)底座

異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源，提高算力利用率

的解決方案。通過混合使用多種異構(gòu)芯片，可以充分利用不同芯片的優(yōu)勢，提高算力利用率，降低算力成本，

發(fā)表于 07-18 00:11 ?3134次閱讀

商湯科技采購40000顆英偉達(dá)芯片，縮小中美算力差距

徐冰認(rèn)為，國產(chǎn)芯片崛起以及算力商品化帶來的投資價(jià)值，使中美算力差距有望逐步縮小。只要中國持續(xù)在

發(fā)表于 05-28 11:25 ?732次閱讀

鯤泰新聞｜神州鯤泰創(chuàng)新智算之旅北京站開幕，發(fā)布全新智算架構(gòu)和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、異構(gòu)、綠色

智算加速平臺HICA以及一體化交付的神州鯤泰全液冷整機(jī)柜產(chǎn)品。幫助企業(yè)客戶在整個(gè)異構(gòu)智算資源池中匹配更優(yōu)算力組合、有效

發(fā)表于 05-22 10:56 ?292次閱讀

鯤泰新聞｜神州鯤泰創(chuàng)新智<b class='flag-5'>算</b>之旅北京站開幕，發(fā)布全新智<b class='flag-5'>算</b>架構(gòu)和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、<b class='flag-5'>異構(gòu)</b>、綠色

全志科技T527高算力八核異構(gòu)芯片獲“年度最佳SoC”榮譽(yù)

全志科技T527高算力八核異構(gòu)芯片獲“年度最佳SoC”榮譽(yù)

發(fā)表于 04-08 10:29 ?1211次閱讀

全志科技T527高<b class='flag-5'>算</b><b class='flag-5'>力</b>八核<b class='flag-5'>異構(gòu)</b>芯片獲“年度最佳SoC”榮譽(yù)

聚焦全國一體化算力體系構(gòu)建，憶聯(lián)以強(qiáng)大存力“引擎”釋放算力潛能

”，充分體現(xiàn)了國家推進(jìn)數(shù)字基建、提升算力一體化的決心。數(shù)據(jù)存儲(chǔ)是算力建設(shè)中的重要一環(huán)，也是數(shù)字經(jīng)

發(fā)表于 03-22 18:13 ?423次閱讀

聚焦全國一體化<b class='flag-5'>算</b><b class='flag-5'>力</b>體系構(gòu)建，憶聯(lián)以強(qiáng)大存<b class='flag-5'>力</b>“引擎”釋放<b class='flag-5'>算</b><b class='flag-5'>力</b>潛能

智能算力規(guī)模超通用算力，大模型對智能算力提出高要求

的縮寫，即每秒所能夠進(jìn)行的浮點(diǎn)運(yùn)算數(shù)目（每秒浮點(diǎn)運(yùn)算量）。 ? 算力可以分為通用算力、智能算力和

發(fā)表于 02-06 00:08 ?5472次閱讀

大茉莉X16-P，5800M大算力稱王稱霸

算力

Rykj365

發(fā)布于 :2024年01月25日 14:54:52

2024年趨勢：算力網(wǎng)絡(luò)、人工智能與6G技術(shù)的融合發(fā)展

算力網(wǎng)絡(luò)以“以網(wǎng)強(qiáng)算”為核心，充分發(fā)揮我國基礎(chǔ)網(wǎng)絡(luò)優(yōu)勢，構(gòu)建算網(wǎng)深度融合的新型信息基礎(chǔ)設(shè)施，通過算

發(fā)表于 01-11 09:30 ?1032次閱讀

燧原科技與青云科技達(dá)成戰(zhàn)略合作，創(chuàng)新異構(gòu)算力調(diào)度

NEWS 燧原科技與青云科技日前達(dá)成戰(zhàn)略合作，攜手創(chuàng)新算力異構(gòu)資源池的靈活調(diào)度，共建支持場景落地的AI算力生態(tài)，為AI應(yīng)用快速落地、AI

發(fā)表于 12-11 12:20 ?502次閱讀

業(yè)界首款存算一體大算力智駕芯片——后摩鴻途H30

算力是人類文明進(jìn)步的基石，從結(jié)繩計(jì)數(shù)到計(jì)算機(jī)的出現(xiàn)，再到智能手機(jī)普及，正是算力指數(shù)級

發(fā)表于 12-04 09:32 ?572次閱讀

阿里云倚天實(shí)例已為數(shù)千家企業(yè)提供算力，性價(jià)比提升超30%

在2023云棲大會(huì)上，阿里云宣布倚天ECS實(shí)例已服務(wù)數(shù)千家企業(yè)，覆蓋電商、生命科學(xué)、交通物流及游戲等領(lǐng)域，整體算力性價(jià)比提升超30%。 2022年，平頭哥自研云原生CPU倚天710在阿

發(fā)表于 11-03 11:25 ?747次閱讀

搜索歷史

超異構(gòu)帶來的算力指數(shù)級提升，使得Chiplet的價(jià)值得到更加充分的發(fā)揮

評論