欧美区2021一二三区在线,日韩国产欧美丝袜在线

01.成熟賽道，后進(jìn)趕超先進(jìn)，很難

1.1 CPU的江湖恩仇

上世紀(jì)70年代，Intel發(fā)明了CPU。通過對CPU的持續(xù)投入，Intel逐漸獲得了市場的優(yōu)勢，并逐漸構(gòu)建起了自己的x86生態(tài)，這包括外圍的硬件合作伙伴、BIOS等固件開發(fā)、操作系統(tǒng)軟件、工具鏈以及應(yīng)用軟件生態(tài)等等。

RISC是一個失敗的例子。X86是CISC架構(gòu)，隨著CISC指令的復(fù)雜度越來越高，越來越難以控制，RISC架構(gòu)逐漸興起。RISC架構(gòu)處理器提倡簡化指令集設(shè)計、固定指令長度、統(tǒng)一指令編碼格式、加速常用指令。RISC架構(gòu)成為很多處理器的首選，并且也成為了許多計算機教材的經(jīng)典CPU設(shè)計案例。但即便如此，在市場競爭上，RISC架構(gòu)仍然輸給了CISC。

安騰是Intel自己的一個失敗的例子。安騰是Intel于2001年推出的64位架構(gòu)的CPU處理器。雖然是Intel的親兒子，雖然是功能強大的64位CPU架構(gòu)，雖然安騰的架構(gòu)和微架構(gòu)設(shè)計非常優(yōu)秀，但因為安騰和x86的不兼容，完全一個新的生態(tài)，也不可避免的走向了失敗。最后成就了AMD64的成功。

ARM的成功，更多源于商業(yè)模式。最開始，ARM自研的處理器性能都非常差，其自研的處理器性能通常是低于一些巨頭客戶自研的ARM架構(gòu)CPU。但因為ARM是一個中立的CPU架構(gòu)和IP供應(yīng)商，很多巨頭愿意扶持著它向前邁進(jìn)。最后在智能手機時代，ARM大獲成功。有了資金實力之后，ARM后續(xù)CPU的性能才逐漸趕上并且部分超越了自己的巨頭客戶。

RISC-V，后起之秀，明日之星，未來可能的成功也是依賴于更優(yōu)的商業(yè)模式。跟ARM當(dāng)年的處境類似，目前的RISCv性能和生態(tài)都要弱于x86和ARM，但因為更優(yōu)的商業(yè)模式（完全開源開放的，并且得到廣泛共識的免費的處理器），其發(fā)展也是相當(dāng)迅猛。

1.2 NVIDIA，從十年磨一劍到市值萬億

傳統(tǒng)的GPU是圖形加速卡，本質(zhì)上是眾多各種領(lǐng)域各種場景加速卡中的一員。除了GPU之外，其他眾多的各類加速卡，幾乎沒有成功的案例。GPU之所以最終成功，來自于00年代NVIDIA的轉(zhuǎn)型：一方面，是GPU從傳統(tǒng)的圖像加速卡，改造成面向并行計算的GPGPU；此外，為了降低開發(fā)的門檻，把更多的資源投向了CUDA，并且對外宣稱自己是一家軟件公司。

即便策略正確，最終的成功驗證也差不多是十年之后。CUDA的最早期版本是在2005年前后發(fā)布的，直到2012年深度學(xué)習(xí)的崛起，GPU才開始真正脫穎而出，也直到2018年大模型興起，以及2013年ChatGPT的火爆，才把NVIDIA推上了最高的神壇。

1.3 簡單總結(jié)

經(jīng)常有企業(yè)喊出口號是“要做中國的xxx”，但“學(xué)我者生，像我者死”，芯片是一個國際化的市場，全球競爭，這樣亦步亦趨的學(xué)習(xí)巨頭企業(yè)的做法，無異于“邯鄲學(xué)步”。

在成熟的賽道，后進(jìn)如果靠模仿先進(jìn)前進(jìn)，那必然無法成功。后進(jìn)需要有差異化，有創(chuàng)新，有優(yōu)勢，才有可能成功。并且，后進(jìn)要想成功，其難度遠(yuǎn)高于先進(jìn)者當(dāng)年的難度。

02.技術(shù)的變革，是最后進(jìn)趕超先進(jìn)的關(guān)鍵時機

國產(chǎn)新能源汽車，是后進(jìn)趕超先進(jìn)的經(jīng)典案例。據(jù)中國汽車工業(yè)協(xié)會整理的海關(guān)總署數(shù)據(jù)顯示，2023年上半年，汽車整車出口234.1萬輛，同比增長76.9%；1～7月，汽車出口總值3837.3億元，增長118.5%。中國汽車出口首次超過日本，躍居世界首位。新能源汽車是中國汽車出口的核心增長點。2023年1～6月出口新能源車80萬輛，同比增長105%。

在成熟賽道，先進(jìn)具有技術(shù)優(yōu)勢、市場優(yōu)勢、專利優(yōu)勢、品牌優(yōu)勢等等，后進(jìn)趕超先進(jìn)很難。但如果是技術(shù)的變革期，后進(jìn)就可以在新的技術(shù)領(lǐng)域提前布局，讓雙方站在同一個起跑線，以此來獲得“公平”競技的機會，從而有可能實現(xiàn)超越。國產(chǎn)汽車，就是抓住了新能源和智能汽車這一波浪潮，迅速地達(dá)到了汽車出口量全球第一。

那么，芯片的變革機會在哪里？

03.AGI大模型的挑戰(zhàn)

2023年初的AI大模型，“不約而同”的參數(shù)規(guī)模停留在千億級，為什么？

核心的原因在于，這是目前的GPU計算集群所能支撐的算力上限：

一方面，單芯片算力已經(jīng)瓶頸，算力增長極度緩慢。

另一方面，受限于目前的服務(wù)器以CPU為中心的架構(gòu)約束，以及網(wǎng)絡(luò)的交互效率所限，集群規(guī)模也已經(jīng)達(dá)到了上限。

還有一個很重要的原因，就是算力的建設(shè)和運營成本，也已經(jīng)達(dá)到了一個天文數(shù)字。

目前CPU性能早已瓶頸，GPU性能即將見頂并且成本高昂，而AI芯片太過于專用，不適用于快速變化的模型算法/算子和業(yè)務(wù)邏輯。

如何解決？我們也可以給一個簡單的答案：

一方面，持續(xù)不斷的Scale up，通過更多的處理器內(nèi)聚，數(shù)量級的提升單芯片的性能；

另一方面，持續(xù)不斷地增強芯片的內(nèi)部交互（打破已有的以CPU為中心的架構(gòu)）和外部交互（增強高性能網(wǎng)絡(luò)）。數(shù)量級的提升集群中服務(wù)器的數(shù)量。

此外，大芯片需要通用。能否實現(xiàn)足夠的通用性，是大芯片能夠大規(guī)模落地的最重要因素。

還有一個很重要的，要通過一些機制，數(shù)量級的降低算力的成本。

04.芯片工藝的快速進(jìn)步

工藝持續(xù)進(jìn)步，Chiplet先進(jìn)封裝也越來越成熟。從2D的工藝到3D的封裝再到Chiplet的4D封裝，芯片的底層實現(xiàn)技術(shù)仍在快速發(fā)展。

目前的大算力芯片，通常在500億晶體管左右。Intel的規(guī)劃是在2030年，達(dá)到1萬億晶體管。這意味著，相比目前的芯片，計算規(guī)模再提升20倍。

如此大規(guī)模的晶體管資源，我們該如何更好地利用？

05.算力芯片變革的歷史機遇

5.1 系統(tǒng)架構(gòu)創(chuàng)新

一方面是需求牽引，一方面是工藝支撐，兩方面的因素，都需要我們在系統(tǒng)架構(gòu)層次，做更多的創(chuàng)新。

從單核到多核、從同構(gòu)到異構(gòu)，從單異構(gòu)到多異構(gòu)，再從多異構(gòu)到異構(gòu)融合，是一個計算架構(gòu)從簡單到復(fù)雜的繼承并發(fā)展的過程。

芯片設(shè)計規(guī)模越來越大，單芯片集成更多架構(gòu)的處理器成為一種非常常見的設(shè)計。這種多異構(gòu)混合計算架構(gòu)，Intel稱為超異構(gòu)計算。在2023年9月份發(fā)布的《異構(gòu)融合計算技術(shù)白皮書》中，采用了更嚴(yán)謹(jǐn)更準(zhǔn)確的一種叫法，“異構(gòu)融合計算”。深刻揭示了多異構(gòu)混合計算的關(guān)鍵，在于異構(gòu)處理器之間的協(xié)同和融合。

5.2 大芯片如何能夠通用？

系統(tǒng)規(guī)模越來越大，變化越來越快，從而使得在大算力芯片，通用性比性能更重要。而定制的加速算力芯片覆蓋場景少，生命周期短，難以大規(guī)模落地。

此外，相比專用，通用是更高級的能力。通用計算，需要從眾多需求中提煉和拆解出通用的部分和組件，通過軟件編程，靈活地組合出用戶所需的形形色色的功能。并且還要實現(xiàn)性能和靈活性的兼顧。

那么，如何實現(xiàn)通用？能夠通用的本質(zhì)原因是什么？

系統(tǒng)規(guī)模越大，“二八定律”特征越明顯。這樣，我們可以把確定性的共性的部分硬件加速實現(xiàn)，相對不確定的個性的部分通過軟件編程實現(xiàn)。

在六代計算架構(gòu)的基礎(chǔ)上，增加“通用”約束，變成三代通用計算架構(gòu)：

第一代單核和第二代多核合并成CPU同構(gòu)。

取消專用的DSA異構(gòu)計算階段，異構(gòu)計算僅保留GPU的通用異構(gòu)。

多異構(gòu)要想成功，就需要融合；異構(gòu)融合要想成功，就需要通用。因此，從終局思維思考，最終可落地的方案，會是通用的異構(gòu)融合計算。

5.3從單兵作戰(zhàn)到團隊協(xié)作

受限于先進(jìn)工藝，我們無法實現(xiàn)最強算力的芯片。但我們可以通過更多資源的協(xié)作，來實現(xiàn)更強的群體智能：

方法一，異構(gòu)融合。通過異構(gòu)融合的計算架構(gòu)創(chuàng)新，實現(xiàn)更多處理器核心的協(xié)同和融合。可以在工藝落后1-2代的情況下，實現(xiàn)單個芯片的算力更優(yōu)。

方法二，算力網(wǎng)絡(luò)。通過算力網(wǎng)絡(luò)、東數(shù)西算，實現(xiàn)跨集群的算力調(diào)度和算力協(xié)同，可以實現(xiàn)算力資源的高效利用。

方法三，智能網(wǎng)聯(lián)。通過終端的智能網(wǎng)聯(lián)，實現(xiàn)云端協(xié)同。清華的***院士提出的智能網(wǎng)聯(lián)汽車中國方案，強調(diào)車（終端）、路（MEC接入）、邊、云的深度協(xié)同，在單體算力有限的情況下，可以實現(xiàn)更智能化的用戶服務(wù)體驗。

方法四，云網(wǎng)邊端融合。更龐大算力節(jié)點，更高性能更低延遲的網(wǎng)絡(luò)，更強大的算力基礎(chǔ)設(shè)施，實現(xiàn)更強大的宏觀數(shù)字系統(tǒng)。

5.4 總結(jié)

從異構(gòu)到異構(gòu)融合計算，計算架構(gòu)的變革，給了我們“彎道超車”的時機；歷史機遇稍縱即逝，需要快馬加鞭，加大投入。

抓住計算架構(gòu)變革的歷史時機，實現(xiàn)算力芯片的彎道超車！

編輯：黃飛

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

新能源汽車

新能源汽車

+關(guān)注

關(guān)注
141

文章
10344

瀏覽量
99147
cpu

cpu

+關(guān)注

關(guān)注
68

文章
10804

瀏覽量
210828
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4855

瀏覽量
102709
RISC

RISC

+關(guān)注

關(guān)注
6

文章
461

瀏覽量
83637
算力芯片

算力芯片

+關(guān)注

關(guān)注
0

文章
42

瀏覽量
4493

原文標(biāo)題：算力芯片，如何突圍？

文章出處：【微信號：算力基建，微信公眾號：算力基建】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

半導(dǎo)體產(chǎn)業(yè)未來10年的機會在哪里？

一個產(chǎn)業(yè)的騰飛離不開終端應(yīng)用市場規(guī)模的爆發(fā)式增長，20年前的筆記本電腦、臺式電腦和家庭影院娛樂系統(tǒng)的大賣，帶來了半導(dǎo)體產(chǎn)業(yè)的大繁榮；10年前的智能手機、數(shù)據(jù)存儲和云計算的大爆發(fā)，讓半導(dǎo)體產(chǎn)業(yè)再次成為焦點；那么從今而后的下一個10年呢？半導(dǎo)體產(chǎn)業(yè)的機會在哪里？

發(fā)表于 02-08 14:58 ?8192次閱讀

半導(dǎo)體產(chǎn)業(yè)未來10年的<b class='flag-5'>機會在哪里</b>？

移動互聯(lián)網(wǎng)的機會在哪里？馬云和比爾·蓋茨看好哪些行業(yè)？

業(yè)內(nèi)流傳的一句話是：誰沒有抓住移動互聯(lián)網(wǎng)的機會，誰就輸?shù)袅宋磥?。比如移動金融的飛速發(fā)展就是明顯的驗證。伴隨人口紅利逐漸消失，中國移動互聯(lián)網(wǎng)進(jìn)入下半場，移動互聯(lián)網(wǎng)下半場機會在哪里？

發(fā)表于 05-19 16:22 ?978次閱讀

Mini LED量產(chǎn)競爭激烈，華燦突圍優(yōu)勢在哪？

從芯片到封裝，紛紛表示下半年是Mini LED量產(chǎn)關(guān)鍵時刻，聽起來競爭非常激烈，華燦突圍的優(yōu)勢在哪里？

發(fā)表于 08-22 15:51 ?4829次閱讀

中國模擬芯片產(chǎn)業(yè)的突圍機會在哪里

隨著國內(nèi)對模擬芯片需求的持續(xù)增加，國內(nèi)模擬芯片廠商也面臨更大的發(fā)展機會。

發(fā)表于 09-23 14:52 ?934次閱讀

國產(chǎn)手術(shù)機器人彎道超車的機會在哪里？

面對龐大的市場機會，國內(nèi)也涌現(xiàn)出了一大批自主研發(fā)創(chuàng)新的團隊。在達(dá)芬奇手術(shù)機器人壟斷國內(nèi)市場 14 年之久的當(dāng)下，國產(chǎn)手術(shù)機器人彎道超車的機會在哪里？對此我們專訪了國內(nèi)的幾家相關(guān)公司。

發(fā)表于 09-08 17:00 ?4164次閱讀

芯片的用途主要用在哪里

芯片的用途主要用在哪里？芯片無處不在，芯片廣泛用于電腦、手機、家電、汽車、高鐵、電網(wǎng)、醫(yī)療儀器、機器人、工業(yè)控制等各種電子產(chǎn)品和系統(tǒng)，芯片在

發(fā)表于 12-22 13:48 ?6.6w次閱讀

宏觀算力建設(shè)實現(xiàn)芯片規(guī)?；?/a>

有的算力芯片，可能可以做到性能狂飆，但較少考慮芯片的通用性易用性，然后芯片銷量不高落地規(guī)模小，那就無法做到宏觀

發(fā)表于 07-05 10:20 ?1004次閱讀

大算力芯片如何加速上車

2022年，汽車智能化、電動化加速推進(jìn)，全球的汽車產(chǎn)業(yè)格局亦在發(fā)生變化，中國企業(yè)紛紛躋身主賽道。中國新能源汽車現(xiàn)在處于怎樣的發(fā)展階段？上汽、廣汽大公司紛紛試水更高級別自動駕駛，大算力芯片如何加速上車？激光雷達(dá)、車載大

發(fā)表于 08-04 09:30 ?912次閱讀

存算一體或?qū)⒊蔀閲a(chǎn)芯片算力彎道超車機會

自動駕駛對大算力芯片提出了新的挑戰(zhàn)。傳統(tǒng)汽車以控制為主，算力要求很小，而 L4 級別的自動駕駛就要求 1000T 以上的

發(fā)表于 09-28 14:26 ?1393次閱讀

存算一體大算力AI芯片的發(fā)展與未來前景

對于被「卡脖子」的國產(chǎn)芯片廠商來說，想要參與這場「算力大戰(zhàn)」，顯然也無法指望依靠制程工藝去實現(xiàn)芯片算力

發(fā)表于 10-13 14:26 ?2825次閱讀

ai芯片和算力芯片的區(qū)別

ai芯片和算力芯片的區(qū)別隨著人工智能和機器學(xué)習(xí)應(yīng)用的不斷發(fā)展，因此種種對硬件的需求也在不斷提高。在這樣的趨勢之下，出現(xiàn)了很多新的芯片產(chǎn)品。

發(fā)表于 08-09 14:24 ?5206次閱讀

大算力芯片里的HBM，你了解多少？

最近，隨著人工智能行業(yè)的高速崛起，大算力芯片業(yè)成為半導(dǎo)體行業(yè)為數(shù)不多的熱門領(lǐng)域HBM(高寬帶內(nèi)存：High-bandwidthmemory)作為大算

發(fā)表于 12-05 16:14 ?1547次閱讀

淺談為AI大算力而生的存算-體芯片

大模型爆火之后，存算一體獲得了更多的關(guān)注與機會，其原因之一是因為存算一體芯片的裸算力相比傳統(tǒng)架構(gòu)

發(fā)表于 12-06 15:00 ?354次閱讀

高算力芯片：未來科技的加速器？

在數(shù)字化時代，芯片作為電子設(shè)備的核心組件，其性能直接關(guān)系到設(shè)備的運行速度和處理能力。而芯片的算力，即其計算能力，更是衡量芯片性能的重要指標(biāo)。

發(fā)表于 02-27 09:42 ?840次閱讀

揭秘芯片算力：為何它如此關(guān)鍵？

在數(shù)字化時代，芯片作為電子設(shè)備的核心組件，其性能直接關(guān)系到設(shè)備的運行速度和處理能力。而芯片的算力，即其計算能力，更是衡量芯片性能的重要指標(biāo)。

發(fā)表于 05-09 08:27 ?822次閱讀