如今,在先進人工智能(AI)和5G應(yīng)用的推動下,Multi-Die系統(tǒng)正在幫助我們實現(xiàn)又一次的重大飛躍。
為了滿足不斷增長的計算資源的需求,原先通過部署本地服務(wù)器的方法因其費用昂貴且安裝耗時耗力已不可行。面對成本壓力、不斷縮小的市場窗口以及市場對更高性能和更多功能的需求,本地存儲已經(jīng)成為許多企業(yè)再也無法承受的負擔。在云端進行IC設(shè)計并通過彈性調(diào)整滿足計算資源需求的時代已然到來。
作為臺積公司開放創(chuàng)新平臺(Open Innovation Platform,OIP)生態(tài)系統(tǒng)的一部分,新思科技最近與臺積公司和微軟合作開展了一項測試,使用新思科技IC Validator物理驗證在Microsoft Azure云中對臺積公司N3E工藝執(zhí)行設(shè)計規(guī)則檢查(DRC)。
設(shè)計規(guī)則檢查的運行時間顯著縮短
我們?yōu)楹芜x擇DRC作為測試用例?因為DRC可以確保設(shè)計正確運行并能在代工廠中制造。但使用傳統(tǒng)的本地計算資源執(zhí)行DRC會占用許多時間,尤其是在設(shè)計變得越來越大和越來越復(fù)雜的情況下。
同時,工藝規(guī)則的數(shù)量往往會隨著設(shè)計的規(guī)模變大,逐步增加。如今許多設(shè)計中的工藝規(guī)則可能多達數(shù)千條,增加的設(shè)計復(fù)雜性導(dǎo)致驗證步驟數(shù)以百計。對于擁有數(shù)十億個晶體管的Multi-Die系統(tǒng),DRC或電路布局驗證(LVS)作業(yè)可能要運行數(shù)天時間,并要用到數(shù)百個CPU內(nèi)核。
因此,在算力集群的超算中心里,先進芯片和先進算力之間并不是劃等號的,算力芯片只是提供了算力,而要高效利用算力還需要依賴光模塊、存儲等芯片的支持。
由于上市時間(TTM)窗口日益縮小,需要的算力進一步增加,且隨著制程節(jié)點從7nm發(fā)展到5nm、3nm甚至更小,進行物理驗證愈來愈有挑戰(zhàn)性。例如,在3nm工藝中,一個運行集就可能包含超過15,000條復(fù)雜規(guī)則,而執(zhí)行這些規(guī)則需要10倍于此數(shù)量的DRC計算操作。因此,全芯片DRC簽核僅一次迭代就可能需要數(shù)萬CPU小時。雖然物理驗證一直是計算密集型工作,但當今設(shè)計的規(guī)模和復(fù)雜性將這一挑戰(zhàn)提升到了一個全新的高度。
運行DRC和LVS作業(yè)存在串行依賴性,這意味著購買更多算力并不一定能保證運行時間更短。IC驗證需要一定的計算規(guī)模,因此在串行操作期間,一些算力有時會閑置。如果不想辦法針對這種情況并優(yōu)化計算資源,開發(fā)者就得為那些未使用的資源付費,甚至影響到最終的利潤。
使用云計算進行IC驗證可以幫助開發(fā)者避免這種情況。通過云端驗證,開發(fā)者可以有效地調(diào)整規(guī)?!獜臄?shù)百個本地CPU內(nèi)核到數(shù)千個云端CPU內(nèi)核。這種彈性為開發(fā)者提供了靈活性、敏捷性和擴展性,讓開發(fā)者可以僅在需要時使用所需的計算資源。運行集內(nèi)的DRC可以分布到多個內(nèi)核上并行運行,從而優(yōu)化計算資源,節(jié)省時間和成本。
云端IC設(shè)計如何使驗證運行時間減少65%
通過本次新思科技、臺積公司與微軟之間的合作,我們對照本地驗證評估了云端驗證。我們將臺積公司的工藝設(shè)計套件(PDK)和DRC上傳到了Synopsys Cloud環(huán)境中來啟動測試,同時根據(jù)新思科技IC Validator(Synopsys Cloud環(huán)境中一個用于物理驗證的獨立應(yīng)用程序)中的設(shè)計類型選擇了不同的、且?guī)в蓄A(yù)先選擇計算選項的資源。通過上傳運行測試用例所需的腳本,并選擇Microsoft Azure實例——FX和Mdsv2計算以及用于共享存儲的Azure Netapp文件(ANF),然后點擊幾下,包含數(shù)百個CPU內(nèi)核的虛擬機(VM)集群就創(chuàng)建好了。
只需幾個小時,我們的實驗流程就已準備好執(zhí)行。我們快速執(zhí)行了一個大型測試用例,以便比較使用臺積公司N3E工藝的作業(yè)在云端運行與在臺積公司本地運行的結(jié)果。所有結(jié)果(云端和本地)都使用異或運算保存在GDSII文件中,兩次運行的任何錯誤必須完全匹配才能得到清晰的結(jié)果。
本地作業(yè)的實時運行時間為大約50小時,而云端作業(yè)時間減少到20小時以下,改善幅度為65%。此外,與在本地運行測試相比,云端測試運行的CPU小時數(shù)和成本降低了25%。
對于臺積公司N3E工藝,云端IC設(shè)計使運行時間減少65%。
(圖源:臺積公司)
新思科技IC Validator是面向現(xiàn)代設(shè)計的物理驗證工具
新思科技IC Validator是一款物理驗證工具,可以在數(shù)千個CPU內(nèi)核之間分配作業(yè)。這項技術(shù)的核心是調(diào)度器,它將每個內(nèi)核的命令排隊,以使用DRC序列優(yōu)化文件位置。它還能估計和平衡所有內(nèi)核的內(nèi)存需求,盡可能地降低峰值磁盤使用率,動態(tài)監(jiān)控每個內(nèi)核的負載,并調(diào)整系統(tǒng)以提高內(nèi)核和內(nèi)存的利用率。它采用異構(gòu)配置并具有容錯功能和真實延遲,所以它能檢測主機重啟、網(wǎng)絡(luò)和套接字故障、機器崩潰以及磁盤空間限制,并恢復(fù)文件。
IC Validator的動態(tài)彈性CPU管理能夠與Load Sharing facility(LSF)和Sun Grid Engine(SGE)等常見作業(yè)排隊系統(tǒng)無縫協(xié)作。它可用于各種不同類型的計算網(wǎng)絡(luò),例如本地和云。它能夠加速時序收斂以滿足流片計劃,同時還會對資源和成本進行優(yōu)化。與傳統(tǒng)DRC和LVS作業(yè)相比,它只需最多40%的計算資源,就能保持相似的性能。在資源和存儲按時間計費的云環(huán)境下,這樣操作也可以節(jié)約成本。
除了以上優(yōu)勢外,IC Validator不需要等到所有資源都可用后才開始作業(yè)。它能夠以最少的資源開始運行,并在其余資源可用時再進行使用。通過單根I/O虛擬化(SR-IOV) 技術(shù),Azure的軟件定義網(wǎng)絡(luò)堆棧將能夠大比例地由CPU分流至FPGA智能網(wǎng)絡(luò)接口卡(NIC)完成處理。綜合Microsoft Azure CycleCloud和加速網(wǎng)絡(luò)技術(shù)的支持,針對虛擬機和更高的數(shù)據(jù)吞吐量的優(yōu)化資源擴展將得到有效保障。
確保云端EDA的安全
除了時間和成本上的所有優(yōu)勢,開發(fā)者還可以采取措施來確保系統(tǒng)得到適當保護,從而保證云端EDA安全無虞。開發(fā)者應(yīng)及時了解最新標準,并確保及時更新網(wǎng)絡(luò)安全系統(tǒng)。擁有管理良好且隔離的虛擬網(wǎng)絡(luò)(VNET)是其中的關(guān)鍵。
原文標題:IC驗證“向云端”:如何聯(lián)合臺積公司和微軟,節(jié)省65%用時,降低25%成本?
文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
新思科技
+關(guān)注
關(guān)注
5文章
775瀏覽量
50191
原文標題:IC驗證“向云端”:如何聯(lián)合臺積公司和微軟,節(jié)省65%用時,降低25%成本?
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論