0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI驅(qū)動(dòng)的國(guó)產(chǎn)硬件仿真芯神鼎如何加速超大規(guī)模芯片設(shè)計(jì)

思爾芯S2C ? 2023-09-22 08:25 ? 次閱讀

近年來,5G、自動(dòng)駕駛、超大規(guī)模計(jì)算,以及工業(yè)物聯(lián)網(wǎng)等領(lǐng)域呈現(xiàn)出強(qiáng)勁的發(fā)展勢(shì)頭。推動(dòng)這些高速發(fā)展的產(chǎn)業(yè)是AI人工智能)和ML(機(jī)器學(xué)習(xí))的大規(guī)模應(yīng)用。這種全新的技術(shù)布局不僅加速了更復(fù)雜的計(jì)算需求、更強(qiáng)的功能性和更快的數(shù)據(jù)傳輸速度,同時(shí)也為芯片研發(fā)人員帶來了前所未有的挑戰(zhàn):即下一代芯片必須更快且更智能。


在當(dāng)前的背景下,由于算力和存儲(chǔ)需求正面臨爆發(fā)式增長(zhǎng),這直接導(dǎo)致推動(dòng)先進(jìn)SoC(系統(tǒng)級(jí)芯片)設(shè)計(jì)和驗(yàn)證的壓力也呈指數(shù)級(jí)增加。特別是在集成電路規(guī)模越來越龐大的現(xiàn)實(shí)情況下,從設(shè)計(jì)到流片(Tape-out)的全流程中,驗(yàn)證變得尤為重要。這是因?yàn)橛行У尿?yàn)證不僅確保了電路在設(shè)計(jì)層面的完善,還保證了其在實(shí)際應(yīng)用中的穩(wěn)定運(yùn)行,從而降低了修正和調(diào)整的成本和時(shí)間。


為了應(yīng)對(duì)這一挑戰(zhàn)并縮短驗(yàn)證周期,硬件仿真成為了超大規(guī)模集成電路驗(yàn)證的首選工具。它能在最短的時(shí)間內(nèi)完成對(duì)電路功能的全面驗(yàn)證,這樣就大大減少了整個(gè)設(shè)計(jì)到生產(chǎn)的周期。同時(shí),AI/ML算力的飛速增長(zhǎng)不僅促進(jìn)了EDA電子設(shè)計(jì)自動(dòng)化)工具的快速演進(jìn),還與EDA工具結(jié)合,催生了一種“雙向加速”的良性循環(huán)。


去年年底,思爾芯推出了首款國(guó)產(chǎn)企業(yè)級(jí)硬件仿真系統(tǒng)——芯神鼎OmniArk。值得一提的是,芯神鼎已將AI應(yīng)用于編譯流程中,這無疑推動(dòng)了芯片設(shè)計(jì)領(lǐng)域的發(fā)展。


芯神鼎硬件仿真系統(tǒng)采用了由AI驅(qū)動(dòng)的智能編譯引擎,該引擎能夠在編譯流程中極大地減少編譯時(shí)間和內(nèi)存占用,實(shí)現(xiàn)增量編譯,并能智能匹配P&R(布局與布線)策略,從而顯著提高布線的成功率。本文將從多個(gè)獨(dú)立模塊的角度,深入探討芯神鼎硬件仿真系統(tǒng)的智能編譯流程。

并行綜合:打破傳統(tǒng)編譯瓶頸

傳統(tǒng)綜合方法充滿了局限性。在集成電路設(shè)計(jì)領(lǐng)域,傳統(tǒng)綜合方法主要有兩種:Top-down綜合和Bottom-up綜合。1.Top-down綜合
該方法對(duì)整個(gè)設(shè)計(jì)進(jìn)行處理,以實(shí)現(xiàn)徹底的優(yōu)化。盡管優(yōu)化程度高,但這一方案的綜合時(shí)間通常非常長(zhǎng),不適用于迅速變化的項(xiàng)目周期。2.Bottom-up綜合
此方法首先對(duì)底層模型進(jìn)行獨(dú)立綜合,然后逐步并入上層模塊進(jìn)行綜合。雖然這適用于一些包含獨(dú)立IP的復(fù)雜設(shè)計(jì),但其在超大規(guī)模集成電路(VLSI)應(yīng)用中表現(xiàn)出速度和靈活性的明顯不足。對(duì)于超大規(guī)模集成電路,這兩種傳統(tǒng)綜合方法通常成為編譯過程的瓶頸。除了時(shí)間效率低下,其對(duì)計(jì)算資源,特別是內(nèi)存的占用也相當(dāng)巨大。
芯神鼎硬件仿真系統(tǒng)對(duì)并行綜合進(jìn)行了創(chuàng)新,采用Module-by-Module的綜合方式,徹底改變了這一現(xiàn)狀。首先,芯神鼎針對(duì)整個(gè)設(shè)計(jì)進(jìn)行必要的全局處理和優(yōu)化,例如XMR(Cross-Module Reference)處理。接著,以Module為最小粒度,啟動(dòng)多核并行綜合過程。這一步是本系統(tǒng)最大的創(chuàng)新之一,它允許系統(tǒng)充分利用服務(wù)器/集群的并行計(jì)算性能。在所有模塊綜合完成之后,系統(tǒng)進(jìn)一步進(jìn)行跨模塊邊界(Cross Module Boundary)邏輯優(yōu)化。此外,芯神鼎能根據(jù)服務(wù)器配置和實(shí)際負(fù)載動(dòng)態(tài)調(diào)節(jié)并行任務(wù)數(shù)量,以實(shí)現(xiàn)負(fù)載均衡。
這種并行綜合方法大大加速了超大規(guī)模集成電路設(shè)計(jì)的整體綜合效率。實(shí)際應(yīng)用中,對(duì)于多核NVDLA(NVIDIA Deep Learning Accelerator)這樣的復(fù)雜設(shè)計(jì)。經(jīng)測(cè)試,其加速率可以達(dá)到驚人的10~100倍,尤其在多核設(shè)計(jì)中表現(xiàn)出色。
通過創(chuàng)新的并行綜合技術(shù),芯神鼎硬件仿真系統(tǒng)成功地突破了傳統(tǒng)綜合方法在時(shí)間和資源效率方面的局限,為超大規(guī)模集成電路設(shè)計(jì)帶來了前所未有的效率提升。
81b6ce2c-58de-11ee-9788-92fbcf53809c.png圖一:并行綜合流程

高效率與高質(zhì)量的智能P&R

在基于硬件仿真的超大規(guī)模設(shè)計(jì)流程中,P&R(布局與布線)通常是編譯的最后一步,負(fù)責(zé)生成最終的bitstream文件。雖然現(xiàn)有的編譯工具提供了多種P&R選項(xiàng),目的是適應(yīng)不同設(shè)計(jì)需求和優(yōu)化目標(biāo),但實(shí)際情況卻遠(yuǎn)沒有那么簡(jiǎn)單。由于各種SoC需求和應(yīng)用場(chǎng)景的多樣性,幾乎沒有一種“通用”的P&R選項(xiàng)組合能適用于所有場(chǎng)景。因此,開發(fā)人員需要根據(jù)特定的設(shè)計(jì)需求,手動(dòng)選擇或調(diào)整P&R選項(xiàng),以求達(dá)到最佳的設(shè)計(jì)輸出。
1. 基于機(jī)器學(xué)習(xí)的智能P&R
芯神鼎硬件仿真系統(tǒng)突破了這一局限,采用基于機(jī)器學(xué)習(xí)(ML)的智能P&R方法。通過使用大量的實(shí)際P&R數(shù)據(jù)進(jìn)行深度訓(xùn)練,系統(tǒng)生成的ML模型能在推理階段輸出最優(yōu)的P&R參數(shù)組合。更值得一提的是,這種基于數(shù)據(jù)驅(qū)動(dòng)的方法在多個(gè)關(guān)鍵性能指標(biāo)上都超過了人工專家的判斷。例如,在布線成功率方面,經(jīng)測(cè)試,可以顯著提高布線通過率;同時(shí),P&R所需的總時(shí)間也可大幅度減少。
2.優(yōu)化任務(wù)調(diào)度和并行計(jì)算
除了使用機(jī)器學(xué)習(xí)進(jìn)行智能選項(xiàng)推薦外,芯神鼎硬件仿真系統(tǒng)還進(jìn)一步優(yōu)化了任務(wù)調(diào)度算法。通過智能任務(wù)調(diào)度,系統(tǒng)能確保在進(jìn)行P&R操作時(shí)充分利用編譯服務(wù)器的多核計(jì)算能力。具體的并行能力和效率提升取決于編譯服務(wù)器的性能和配置。
通過集成基于機(jī)器學(xué)習(xí)的智能P&R以及高效的任務(wù)調(diào)度和并行計(jì)算功能,芯神鼎硬件仿真系統(tǒng)為FPGA設(shè)計(jì)提供了一種更高效、更質(zhì)量可控的解決方案。這不僅大幅減少了編譯時(shí)間,同時(shí)也顯著提升了輸出結(jié)果的質(zhì)量。
81cc3b22-58de-11ee-9788-92fbcf53809c.png圖二:任務(wù)調(diào)度和并行計(jì)算流程

增量編譯

在超大規(guī)模集成電路(VLSI)的設(shè)計(jì)過程中,即使進(jìn)行了多方面的編譯流程優(yōu)化,編譯時(shí)間依然可能成為項(xiàng)目進(jìn)度的瓶頸。更進(jìn)一步地說,對(duì)于那些已經(jīng)編譯過但需做細(xì)微修改的工程,每次都進(jìn)行全量編譯會(huì)大大延長(zhǎng)開發(fā)周期,耗費(fèi)人力和計(jì)算資源。
增量編譯(Incremental Compilation)是一種編程優(yōu)化策略,用于加快編譯過程。在一個(gè)大型或復(fù)雜的代碼基礎(chǔ)上,每次進(jìn)行全量編譯(即重新編譯整個(gè)代碼基礎(chǔ))通常會(huì)消耗大量時(shí)間和計(jì)算資源。增量編譯的目標(biāo)是只重新編譯自上次編譯后發(fā)生變化或被影響的代碼部分,而不是整個(gè)代碼庫。
增量編譯系統(tǒng)首先會(huì)跟蹤代碼中各模塊、函數(shù)或文件的依賴關(guān)系。當(dāng)某一部分代碼發(fā)生改動(dòng)后,編譯系統(tǒng)會(huì)識(shí)別這一改動(dòng),并查找所有依賴于該部分的其他代碼。只有被改動(dòng)的代碼和依賴于它的代碼會(huì)被重新編譯。其它未改動(dòng)和不受影響的代碼則不需要重新編譯。重新編譯的代碼會(huì)與舊的編譯結(jié)果合并,生成一個(gè)更新的可執(zhí)行文件或庫。對(duì)于代碼庫非常大的項(xiàng)目,增量編譯幾乎是必需的。
芯神鼎硬件仿真系統(tǒng)便采用了這種增量編譯策略。它采用了一種先進(jìn)的增量編譯引擎,該引擎涵蓋了綜合模塊、Partition模塊以及工程生成模塊等關(guān)鍵部分。這些模塊都集成了增量編譯技術(shù),可以在二次編譯過程中智能感知用戶所做的任何修改。這種自動(dòng)感知機(jī)制極大地減少了重新編譯所需的計(jì)算量,因?yàn)樗会槍?duì)修改過的部分進(jìn)行編譯,而非整個(gè)設(shè)計(jì)。這樣不僅大幅度縮短了編譯時(shí)間,還優(yōu)化了資源使用效率。81d1bd22-58de-11ee-9788-92fbcf53809c.png圖三:增量編譯流程

總結(jié)


AI+EDA的結(jié)合代表了一次跨越式的技術(shù)進(jìn)步,它不僅有望延續(xù)并拓展摩爾定律的生命周期,還能顯著節(jié)約研發(fā)時(shí)間和資本投入,提升行業(yè)整體競(jìng)爭(zhēng)力。進(jìn)一步地,這一結(jié)合還為全球芯片設(shè)計(jì)領(lǐng)域開創(chuàng)了全新的可能性,比如通過機(jī)器學(xué)習(xí)算法優(yōu)化設(shè)計(jì)流程,從而縮短產(chǎn)品上市時(shí)間,或者在更短的時(shí)間內(nèi)完成更為復(fù)雜的設(shè)計(jì)任務(wù)。
芯神鼎硬件仿真系統(tǒng)集多種創(chuàng)新技術(shù)于一身,如并行綜合、智能P&R和增量編譯等模塊,不僅大幅度縮短了編譯時(shí)間,還提高了整體編譯質(zhì)量。這些模塊都運(yùn)用了我們自主研發(fā)的先進(jìn)技術(shù),為客戶在超大規(guī)模集成電路驗(yàn)證方面提供了強(qiáng)有力的支持。除了應(yīng)對(duì)現(xiàn)有的編譯挑戰(zhàn),我們的解決方案還具備極強(qiáng)的可擴(kuò)展性,能夠適應(yīng)未來更高復(fù)雜度的工程需求。
通過持續(xù)的研發(fā)和創(chuàng)新,芯神鼎硬件仿真系統(tǒng)有望成為推動(dòng)整個(gè)集成電路設(shè)計(jì)行業(yè)進(jìn)入新“智”元的重要力量,開啟一個(gè)全新的、以數(shù)據(jù)和算法為驅(qū)動(dòng)的芯片設(shè)計(jì)時(shí)代。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片設(shè)計(jì)
    +關(guān)注

    關(guān)注

    15

    文章

    980

    瀏覽量

    54618
  • 仿真
    +關(guān)注

    關(guān)注

    50

    文章

    3971

    瀏覽量

    132953
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3112

    瀏覽量

    65844
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266203
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Zettabyte與緯創(chuàng)攜手打造臺(tái)灣首個(gè)超大規(guī)模AI數(shù)據(jù)中心

    在推動(dòng)亞太地區(qū)AI計(jì)算領(lǐng)域邁向新紀(jì)元的征程中,Zettabyte與緯創(chuàng)資通(Wistron Corporation)攜手宣布了一項(xiàng)重大合作——共同建設(shè)臺(tái)灣地區(qū)首個(gè)超大規(guī)模AI數(shù)據(jù)中心,這一里程碑式的項(xiàng)目不僅標(biāo)志著臺(tái)灣
    的頭像 發(fā)表于 09-05 16:26 ?227次閱讀

    谷歌正在考慮在越南建設(shè)超大規(guī)模數(shù)據(jù)中心

    據(jù)可靠消息透露,Alphabet集團(tuán)旗下的谷歌公司正積極籌劃在越南南部的經(jīng)濟(jì)樞紐胡志明市周邊建設(shè)一座“超大規(guī)模”數(shù)據(jù)中心。此舉標(biāo)志著美國(guó)科技巨頭首次在東南亞國(guó)家進(jìn)行此類重大投資,盡管具體的投資金額尚待揭曉。
    的頭像 發(fā)表于 08-30 14:55 ?425次閱讀

    形式驗(yàn)證如何加速超大規(guī)模芯片設(shè)計(jì)?

    引言隨著集成電路規(guī)模的不斷擴(kuò)大,從設(shè)計(jì)到流片(Tape-out)的全流程中,驗(yàn)證環(huán)節(jié)的核心地位日益凸顯。有效的驗(yàn)證不僅是設(shè)計(jì)完美的基石,更是確保電路在實(shí)際應(yīng)用中穩(wěn)定運(yùn)行的保障。尤為關(guān)鍵的是,邏輯或
    的頭像 發(fā)表于 08-30 12:45 ?300次閱讀
    形式驗(yàn)證如何<b class='flag-5'>加速</b><b class='flag-5'>超大規(guī)模</b><b class='flag-5'>芯片</b>設(shè)計(jì)?

    超大規(guī)模集成電路(VLSI)中不可或缺的5種二極管

    在快速發(fā)展的超大規(guī)模集成電路(VLSI)設(shè)計(jì)世界中,選擇正確的組件對(duì)于優(yōu)化性能和效率至關(guān)重要。二極管在超大規(guī)模集成電路的各種應(yīng)用中起著不可或缺的作用,從整流到電壓調(diào)節(jié)。本文深入研究了2024年
    的頭像 發(fā)表于 08-20 18:28 ?404次閱讀
    <b class='flag-5'>超大規(guī)模</b>集成電路(VLSI)中不可或缺的5種二極管

    如何利用低功耗設(shè)計(jì)技術(shù)實(shí)現(xiàn)超大規(guī)模集成電路(VLSI)的電源完整性?

    本文要點(diǎn)超大規(guī)模集成電路(Verylargescaleintegration,VLSI)是一種主流的集成電路(IC)設(shè)計(jì)模式。芯片尺寸微型化有助于降低單個(gè)晶體管的功耗,但同時(shí)也提高了功率密度。先進(jìn)
    的頭像 發(fā)表于 08-03 08:13 ?649次閱讀
    如何利用低功耗設(shè)計(jì)技術(shù)實(shí)現(xiàn)<b class='flag-5'>超大規(guī)模</b>集成電路(VLSI)的電源完整性?

    SAS 24G+規(guī)范發(fā)布,為超大規(guī)模數(shù)據(jù)中心HDD和SSD

    在當(dāng)前超大規(guī)模數(shù)據(jù)中心的演進(jìn)歷程中,盡管固態(tài)硬盤正日益向支持NVMe協(xié)議的PCIe接口轉(zhuǎn)型,但串行連接SCSI(SAS)技術(shù)依然是眾多關(guān)鍵應(yīng)用不可或缺的支柱。SAS存儲(chǔ)技術(shù)的生命力遠(yuǎn)未枯竭,這一點(diǎn)從
    的頭像 發(fā)表于 07-25 15:13 ?544次閱讀

    燧原科技與清程極智攜手共創(chuàng)AI未來:共筑超大規(guī)模智算集群新篇章

    協(xié)議,雙方將攜手步入全新的合作階段,共同探索并開發(fā)面向超萬億參數(shù)大模型和超大規(guī)模集群的高性能系統(tǒng)軟件方案,標(biāo)志著雙方在推動(dòng)AI技術(shù)邊界、加速產(chǎn)業(yè)智能化進(jìn)程上邁出了堅(jiān)實(shí)的一步。
    的頭像 發(fā)表于 07-05 14:50 ?540次閱讀

    Arm計(jì)劃2025年大規(guī)模銷售AI芯片

    軟銀集團(tuán)旗下的英國(guó)芯片巨頭Arm近日公布了其雄心勃勃的AI芯片銷售計(jì)劃。該公司宣布,計(jì)劃到2025年實(shí)現(xiàn)AI芯片
    的頭像 發(fā)表于 05-20 10:48 ?497次閱讀

    Cerebras推WSE-3芯片,性能翻倍,助力超大規(guī)模AI模型訓(xùn)練

    首先,WSE-3采用臺(tái)積電最新的5nm工藝制作(目前領(lǐng)先業(yè)界)。其次,該芯片擁有超過4萬億個(gè)晶體管以及90萬個(gè)AI核心,配合44GB片上SRAM高速緩存及三種可選片外存儲(chǔ)方案(分別是1.5TB、12TB與1.2PB)。
    的頭像 發(fā)表于 03-14 10:01 ?606次閱讀

    超大規(guī)模數(shù)據(jù)中心采用三星FDP SSD降低存儲(chǔ)成本

    主機(jī)數(shù)據(jù)放置技術(shù)一直是超大規(guī)模數(shù)據(jù)中心關(guān)注的話題,因?yàn)樗绊懰渴鸬腟SD的總體擁有成本(TCO)。
    的頭像 發(fā)表于 03-07 15:39 ?1398次閱讀
    <b class='flag-5'>超大規(guī)模</b>數(shù)據(jù)中心采用三星FDP SSD降低存儲(chǔ)成本

    晶晟微納發(fā)布N800超大規(guī)模AI算力芯片測(cè)試探針卡

    近日,上海韜盛科技旗下的蘇州晶晟微納宣布推出其最新研發(fā)的N800超大規(guī)模AI算力芯片測(cè)試探針卡。這款高性能探針卡采用了前沿的嵌入式合金納米堆疊技術(shù),旨在滿足當(dāng)前超大規(guī)模
    的頭像 發(fā)表于 03-04 13:59 ?729次閱讀

    中國(guó)電信規(guī)劃在上海建設(shè)首個(gè)國(guó)產(chǎn)超大規(guī)模算力液冷集群

    中國(guó)電信規(guī)劃建設(shè)首個(gè)國(guó)產(chǎn)超大規(guī)模算力液冷集群 人工智能技術(shù)的快速發(fā)展催生了巨大的算力需求;中國(guó)電信規(guī)劃在上海規(guī)劃建設(shè)可支持萬億參數(shù)大模型訓(xùn)練的智算集群中心。其中會(huì)搭載液冷技術(shù),單池新建國(guó)產(chǎn)算力達(dá)10000卡,也是首個(gè)支持單池萬卡
    的頭像 發(fā)表于 02-22 18:48 ?1224次閱讀

    豐與國(guó)科技簽署戰(zhàn)略合作協(xié)議

    近日,天津易豐動(dòng)力科技有限公司(簡(jiǎn)稱“易豐”)與蘇州國(guó)科技股份有限公司(簡(jiǎn)稱“國(guó)科技”)正式簽署戰(zhàn)略合作協(xié)議。雙方將共同致力于汽車核心芯片
    的頭像 發(fā)表于 01-24 17:02 ?767次閱讀

    華章與擎科技合作助力大規(guī)模縮短產(chǎn)品上市周期

    大規(guī)模縮短產(chǎn)品上市周期,加速新一代智能駕駛芯片創(chuàng)新。 隨著中國(guó)智能汽車產(chǎn)業(yè)蓬勃發(fā)展,車規(guī)級(jí)芯片也迎來了發(fā)展的“黃金時(shí)代”。作為國(guó)內(nèi)唯一實(shí)現(xiàn)7納米車規(guī)
    的頭像 發(fā)表于 12-04 09:09 ?1407次閱讀

    6G超大規(guī)模多天線的技術(shù)演進(jìn)歷程

    從3G到5G時(shí)代,天線規(guī)模發(fā)生了顯著的變化,5G超大規(guī)模天線技術(shù)具有許多優(yōu)勢(shì),但面向6G的極致性能要求還需持續(xù)演進(jìn)
    發(fā)表于 11-21 09:19 ?664次閱讀
    6G<b class='flag-5'>超大規(guī)模</b>多天線的技術(shù)演進(jìn)歷程