0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Auto-Scale如何大幅提升Virtuoso仿真效率?

OpenFPGA ? 來源: 速石科技 ? 2023-08-18 11:14 ? 次閱讀

這是我們EDA云實證的第四期。

本期實證的主角是——Virtuoso。

半導(dǎo)體行業(yè)中使用范圍最廣的EDA應(yīng)用之一。

1991年Virtuoso技術(shù)正式發(fā)布,最初作為掩模設(shè)計師的版圖工具,是Opus平臺的一部分,主要功能包括電路設(shè)計仿真、版圖設(shè)計、設(shè)計驗證,以及模擬/數(shù)字混合設(shè)計等。

近30年來,Virtuoso產(chǎn)品已和最初有很大不同,但其核心仍然是版圖編輯器。

應(yīng)用工具層面。Cadence一直致力于優(yōu)化EDA應(yīng)用算法和性能,提高自動化水平,將Virtuoso逐漸升級和擴(kuò)展為集合多項新技術(shù)的系統(tǒng)設(shè)計平臺。

而從應(yīng)用到云資源層,就由我們來發(fā)揮了。

我們針對EDA應(yīng)用云原生適配,為IC研發(fā)設(shè)計人員提供一整套即開即用,快速上手的IC研發(fā)設(shè)計環(huán)境,系統(tǒng)性大幅提升研發(fā)效率。

我們到底是怎么做到的?

研發(fā)效率具體提高在哪些方面?

什么是即開即用的IC研發(fā)設(shè)計環(huán)境?好用嗎?改變原來習(xí)慣嗎?

以下是今天的正文:

用戶需求

芯片設(shè)計公司做數(shù)?;旌闲酒?jīng)常使用Virtuoso調(diào)用Spectre完成仿真任務(wù),需要趕MPW shuttle,即將面臨多項目同時進(jìn)行、項目關(guān)鍵時間節(jié)點相同的困境。

公司CEO并不想單純靠增加本地機(jī)器來解決目前問題,一方面考慮到會對企業(yè)造成比較大的現(xiàn)金流壓力,另一方面公司并沒有專門的IT和CAD團(tuán)隊。他對能不能用云解決現(xiàn)有問題十分重視,也直接和云廠商交流過,對我們的云上自動化和Auto-Scale功能很感興趣。

實證目標(biāo)

1、fastone平臺是否支持在云端使用Virtuoso運(yùn)行仿真任務(wù)?

2、通過平臺使用Virtuoso和本地差別大嗎?

3、Auto-Scale自動化伸縮具體怎么實現(xiàn)的?

4、Slurm調(diào)度器行不行?

實證參數(shù)

平臺:

fastone企業(yè)版產(chǎn)品

應(yīng)用:

Cadence Virtuoso

適用場景:

數(shù)模混合電路設(shè)計及仿真

云端硬件配置:

Spectre仿真主要需要的是計算密集型CPU,所以平臺推薦的是計算優(yōu)化型云端實例

調(diào)度器:

Slurm(關(guān)于調(diào)度器,下文會詳細(xì)講解)

技術(shù)架構(gòu)圖:

wKgZomTe4jyAcltFAAB1TK19qrg722.png

一整套即開即用的IC研發(fā)設(shè)計環(huán)境

操作像吃了德芙般順滑

用戶對于在本地單機(jī)使用Virtuoso運(yùn)行仿真任務(wù),已經(jīng)非常熟悉。

而對于在云上跑,用戶依然有以下疑問:

什么叫一整套?從哪一步到哪一步?

云上使用Virtuoso,操作方式會改變嗎?會不會很麻煩?

我們?yōu)橛脩籼峁┑漠a(chǎn)品,從登錄桌面、打開應(yīng)用、配置仿真、提交任務(wù)、自動上云開機(jī)運(yùn)行任務(wù)并自動關(guān)機(jī)、查看結(jié)果進(jìn)行調(diào)試……用戶所需要的操作與本地幾乎完全一致,每一步只需在平臺上使用鼠標(biāo)簡單點選即可完成。

wKgZomTe4jyAIMXFAADaImWJkXw907.jpg

我們說的“一整套”,就是這個意思。

至于操作方式會不會改變?

拿訪問集群舉例。

用戶訪問集群,既可以通過命令行,也可以通過WebVNC圖形界面方式直接訪問。

手動模式訪問集群,一共有五步, **往往還需要請IT先配置環(huán)境 ** :

1、在云端開一臺機(jī)器;

2、在云端安裝VNC服務(wù)并進(jìn)行配置,有幾個用戶使用就需要配置幾個賬號;

3、在本地安裝VNC服務(wù)并進(jìn)行配置;

4、在云端開啟VNC服務(wù);

5、用戶使用各自賬號登錄客戶端VNC訪問云端。

我們?yōu)樗杏脩裘赓M提供WebVNC功能,自動化創(chuàng)建到訪問集群:

1、通過Web瀏覽器登錄fastone平臺;

2、在Web界面新建集群、配置資源;

3、在已創(chuàng)建的集群點擊WebVNC遠(yuǎn)程桌面圖標(biāo)(同時提供WebSSH遠(yuǎn)程命令行功能);

4、跳轉(zhuǎn)到虛擬桌面,可在該桌面中操作Virtuoso。

wKgaomTe4jyASgAAAALB8UO__EE618.png

我們還提供了統(tǒng)一的用戶認(rèn)證,不同用戶可以直接訪問VNC,無需重新配置。

這種操作方式給用戶提供了熟悉的操作環(huán)境,使其能夠快速地遠(yuǎn)程自動化訪問集群,避免了大量的手動部署,使用體驗更好。

在數(shù)據(jù)傳輸上,我們同樣為用戶提供了不改變操作習(xí)慣的DM工具,用戶無需在多套認(rèn)證系統(tǒng)之間切換,使用統(tǒng)一的身份認(rèn)證即可傳輸數(shù)據(jù),并自動關(guān)聯(lián)云端集群進(jìn)行計算,具體看這里《CAE云實證Vol.8:LS-DYNA求解效率深度測評 │ 六種規(guī)模,本地VS云端5種不同硬件配置》

當(dāng)然,好處遠(yuǎn)遠(yuǎn)不止這些。

Auto-Scale自動伸縮就像仙女棒

變大變小變漂亮

fastone通過Auto-Scale功能實現(xiàn)自動化創(chuàng)建集群的過程,可以實現(xiàn)自動監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動態(tài)按需地開啟所需算力資源,在提升效率的同時有效降低成本。

怎么讓仙女棒發(fā)揮作用?

先來設(shè)置一下:

wKgaomTe4jyANfU3AAEfP5PCOrs818.png

下圖就是開啟Auto-Scale功能后,用戶某項目一周之內(nèi)所調(diào)用云端計算資源的動態(tài)情況。

其中橙色曲線為OD實例的使用狀況,紅色曲線為SPOT的使用狀況。

OD:On-Demand,按需實例。針對短期彈性需求,按小時計費,但價格比較高。

SPOT:可被搶占實例,又稱競價實例。價格最低可達(dá)到按需實例價格的10%,相當(dāng)于秒殺,手快有手慢無,隨時可能被搶占中斷,需要有一定的技術(shù)實力才能使用。

wKgaomTe4jyAAu0wAAEkDnmwn7U507.png

兩個重點:

第一、從圖中可以看到整個階段算力波峰為約3500核,而波谷只有650核左右。用戶使用資源是存在明顯的波峰波谷周期的。Auto-Scale功能可以根據(jù)任務(wù)運(yùn)算情況動態(tài)開啟云端資源,并在波峰過去后自動關(guān)閉,讓資源的使用隨著用戶的需求自動擴(kuò)張及縮小,最大程度匹配任務(wù)需求。

當(dāng)然,用戶也可以選擇自己對最大最小值進(jìn)行設(shè)置,加以限制。

這一方面節(jié)約了用戶成本,不需要時刻保持最高峰使用資源;

另一方面也最大限度保證了任務(wù)最大效率運(yùn)行。

比如跑100個corner的仿真,以前只能同時跑10個,要花10天,現(xiàn)在可以同時跑100個,只要1天就可以完成。這兩種方式成本相同,為用戶節(jié)約出了顯著的時間差,大大縮短了任務(wù)運(yùn)行周期,提升了研發(fā)效率。

第二、我們的Auto-Scale功能支持對不同計費模式(OD、SPOT)實例進(jìn)行自動伸縮,OD按需實例價格通常為SPOT實例的3-10倍。

Auto-Scale功能可以根據(jù)不同的用戶策略,比如成本最優(yōu)還是時間優(yōu)先,自動化跨區(qū)、跨類型為用戶調(diào)度云資源,完成計算任務(wù)。

至于不同策略具體怎么落地執(zhí)行?相比時間優(yōu)先策略,成本優(yōu)先怎么做到降低成本最多達(dá)67%-90%?在這篇實證《生信云實證Vol.3:提速2920倍!用AutoDockVina對接2800萬個分子》里體現(xiàn)得十分明顯。

wKgaomTe4jyAHTtYAAB8_u7lUig864.jpg

不僅限于運(yùn)行任務(wù)期間,其實早在創(chuàng)建集群的時候,自動化Auto-Scale過程就已經(jīng)開始了。

在這篇Bladed實證里,fastone平臺在任務(wù)的不同階段采取不同的策略應(yīng)對,除任務(wù)運(yùn)行時間內(nèi)全部云資源滿負(fù)荷運(yùn)作以外,在數(shù)據(jù)處理和結(jié)果數(shù)據(jù)上傳階段均只開啟了1-2臺機(jī)器,而其他準(zhǔn)備過程不需要開啟機(jī)器。

wKgZomTe4j2ATWPdAADEXx3XfZM711.jpg

習(xí)慣了LSF/SGE

Slurm調(diào)度器到底行不行?

為什么選擇Slurm調(diào)度器?

Virtuoso應(yīng)用原生支持的調(diào)度器有LSF和SGE。

LSF作為商業(yè)軟件,由IBM提供商業(yè)支持,是半導(dǎo)體行業(yè)最常用的調(diào)度器軟件。曾經(jīng)衍生出的開源版Openlava在2016后IBM發(fā)起的版權(quán)訴訟之后,2018年正式被禁用。

SGE商業(yè)版在去年已經(jīng)隨Univa被Altair收購。類似的,免費開源版已經(jīng)長期無維護(hù)和更新,也存在版權(quán)風(fēng)險。

LSF和SGE均按核時收費,價格不菲,如果在云端大規(guī)模使用,價格驚人,而且都需要購買單獨的Resource Connector或Navops Launch產(chǎn)品才能支持在云上使用。

而Slurm作為調(diào)度器四大流派里唯一的純開源派,就不受規(guī)模和費用的限制了。而且Slurm擁有容錯率高、支持異構(gòu)資源、高度可擴(kuò)展等優(yōu)點,每秒可提交超過1000個任務(wù),且由于是開放框架,高度可配置,擁有超過100種插件,因此適用性相當(dāng)強(qiáng)。

所以我們優(yōu)先選擇Slurm。

關(guān)于這四家主流調(diào)度器:LSF/SGE/Slurm/PBS以及它們的9個演化版本,可以看這篇文章《億萬打工人的夢:16萬個CPU隨你用》,我們進(jìn)行了整體梳理和盤點,尤其是對云的支持方面劃了重點。

我們是怎么實現(xiàn)的?

答案是:SGE Wrapper。

Wrapper是什么呢?

可以看看下圖,可以看到同樣的命令在不同的調(diào)度器之間有不同的實現(xiàn)方式:

wKgaomTe4j2AUKsOAAOMcZHvvH8131.png

而Wrapper就像不同調(diào)度器命令語言中的翻譯器,我們相當(dāng)于通過這個翻譯器,把Slurm語言翻譯成了Virtuoso聽得懂的SGE語言,于是應(yīng)用就能正常運(yùn)行啦。

關(guān)于不同調(diào)度器的使用效果。

我們曾經(jīng)在ProteusOPC實證場景四中分別使用SGE和Slurm在云端和本地分別調(diào)度2000核/5000核運(yùn)行相同OPC任務(wù)。

wKgaomTe4j2ARKmHAAGY9ioUQQE718.png

結(jié)論是:對于計算結(jié)果無影響。

關(guān)于調(diào)度器如何在多機(jī)器多任務(wù)的情況下提升資源利用率,并進(jìn)行自動化管理,可以看這篇《EDA云實證Vol.7:揭秘20000個VCS任務(wù)背后的“搬桌子”系列故事》

任務(wù)監(jiān)控還能搞出省錢大招?

根據(jù)我們對整個任務(wù)消耗資源狀態(tài)的監(jiān)控,發(fā)現(xiàn)運(yùn)算該組任務(wù)所使用的內(nèi)存大部分時間在5G以下,但會有極短的一段時間(不超過半小時)達(dá)到17.5G。

wKgZomTe4j2AAZ8HAAJ9etIiLI8912.png

從上圖中可以看到,Swap剩余量在短時間內(nèi)從8.6G跌到了7.1G,隨后很快回升到了8.38G,也就是說如果沒有Swap,運(yùn)行內(nèi)存的瞬時缺口約為1.5G,勢必造成任務(wù)失敗。

Swap,交換分區(qū),就是在內(nèi)存不夠的情況下,操作系統(tǒng)先把內(nèi)存中暫時不用的數(shù)據(jù),存到硬盤的交換空間,騰出內(nèi)存來讓別的程序運(yùn)行。

如果配置16G的內(nèi)存,任務(wù)最后會因此失敗。

但如果選擇配置32G內(nèi)存,著實有點浪費,畢竟也就超了一點點。

而同等CPU資源下,配備32G內(nèi)存的價格普遍要比16G貴1.4-1.9倍。

wKgZomTe4j2AKC3yAACzm3-PpjE570.png

正是由于完備的監(jiān)控和任務(wù)性能評估機(jī)制,我們建議用戶在云端運(yùn)算時配備16G內(nèi)存,同時使用Swap功能渡過這段內(nèi)存波峰,以達(dá)到最高的性價比。

實證小結(jié)

1、fastone平臺支持在云端使用Virtuoso調(diào)用Spectre運(yùn)行仿真任務(wù);

2、用戶使用這套研發(fā)設(shè)計環(huán)境能閉環(huán)完成Virtuoso運(yùn)行任務(wù),且基本不改變用戶習(xí)慣;

3、fastone平臺的云上自動化模式和Auto-Scale功能能有效幫用戶縮短研發(fā)周期,同時降低使用成本;

4、Slurm調(diào)度器不會影響計算結(jié)果,是更具性價比及擴(kuò)展性的選擇;

5、fastone平臺擁有完備的監(jiān)控及任務(wù)性能評估機(jī)制。

本次EDA實證系列Vol.10就到這里了。

下一期我們聊HFSS。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    334

    文章

    26331

    瀏覽量

    210090
  • 仿真
    +關(guān)注

    關(guān)注

    50

    文章

    3972

    瀏覽量

    132968
  • eda
    eda
    +關(guān)注

    關(guān)注

    71

    文章

    2654

    瀏覽量

    172184
  • Virtuoso
    +關(guān)注

    關(guān)注

    4

    文章

    17

    瀏覽量

    25001

原文標(biāo)題:Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?

文章出處:【微信號:Open_FPGA,微信公眾號:OpenFPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    倉庫管理系統(tǒng)大幅提升企業(yè)效率

    隨著條碼技術(shù)、通信技術(shù)和數(shù)據(jù)庫技術(shù)的不斷進(jìn)步,使得食品行業(yè)開始優(yōu)化庫存管理和分銷網(wǎng)絡(luò),大幅提升管理的精確和實時的效率,進(jìn)而降低相關(guān)的成本和勞動力,提升其市場競爭力。
    發(fā)表于 11-11 14:22 ?1054次閱讀

    請問Pspice Model可以導(dǎo)入virtuoso仿真嗎?

    TI芯片中的Pspice Model可以導(dǎo)入virtuoso仿真嗎?
    發(fā)表于 08-12 07:06

    變量觀測圖形顯示,auto scale 為什么沒有起作用?

    為什么CCS6.0做變量值的觀測時,auto scale似乎沒有起到作用,看不到變量總體的趨勢
    發(fā)表于 12-01 12:08

    DDR2開cacheability后與L2的效率比較,請問誰能解釋下這個沒有大幅效率提升可能是什么原因?

    cacheability的1.2倍(比全部在L2中多了EDMA啟動開銷)左右,感覺這個提升幅度有低。理想情況EDMA搬移數(shù)據(jù)到L2中計算,其效率應(yīng)該是在開啟DDR2 cacheability的效率的幾倍?誰能解釋下這個沒有
    發(fā)表于 06-22 07:56

    virtuoso仿真出現(xiàn)ERROR (OSSHNL-514),該怎么解決?

    errors and regenerate the netlist....unsuccessful.Virtuoso 6.17 仿真出現(xiàn)如上錯誤,原理檢查只是出現(xiàn)警告,請問這要怎么解決?謝謝`
    發(fā)表于 07-17 20:43

    virtuoso仿真

    or subcircuit, `nmos_6p0'. Either include the。。。。仿真前需要設(shè)置model libraries,這個怎么設(shè)置啊。我用的是virtuoso 6.1.7
    發(fā)表于 07-19 20:16

    基于Virtuoso平臺的單片射頻收發(fā)系統(tǒng)電路仿真與版圖設(shè)計

    的設(shè)計平臺。在綜合比較后,本文選定了CadenceVirtuoso全定制IC設(shè)計工具。VirtUOSO是Cadence公司推出的用于模擬/數(shù)字混合電路仿真和射頻電路仿真的專業(yè)軟件?;诖似脚_
    發(fā)表于 11-26 10:56

    virtuoso軟件里怎么樣仿真混頻器的隔離度呢?

    請問一下,對于BiCMOS工藝設(shè)計的混頻器,在virtuoso軟件里怎么樣仿真其隔離度呢?
    發(fā)表于 06-24 07:00

    virtuoso中進(jìn)行CMOS反相器和靜態(tài)寄存器的電路設(shè)計

    這篇博客記錄一下virtuoso中進(jìn)行CMOS反相器和靜態(tài)寄存器的電路設(shè)計以及功能仿真,適合入門。還做了版圖設(shè)計,但是自己對原理不是不清楚,在此就不記錄了。virtuoso電路設(shè)計環(huán)境基本教學(xué)一
    發(fā)表于 11-12 06:28

    Cadence助力Denso大幅提升IC設(shè)計效率

    Cadence 設(shè)計系統(tǒng)公司日前宣布,汽車零部件生產(chǎn)商Denso公司在改用了Cadence定制/模擬與數(shù)字流程之后,在低功耗混合信號IC設(shè)計方面實現(xiàn)了質(zhì)量與效率大幅提升。將Cadence Encounter RTL-to-G
    發(fā)表于 09-04 09:31 ?902次閱讀

    WillSemi采用的Cadence Virtuoso定制IC設(shè)計平臺有哪些優(yōu)點?

    的設(shè)計時間。同時,其便捷的連線功能在大幅縮短電路原理圖創(chuàng)建時間的同時減少錯誤發(fā)生。采用Virtuoso版圖套件,WillSemi團(tuán)隊可以用基于電路原理圖約束條件的方法來提高版圖設(shè)計的效率,并
    發(fā)表于 08-08 18:11 ?1429次閱讀

    機(jī)器加裝傳感器 大幅提升企業(yè)營運(yùn)運(yùn)轉(zhuǎn)效率

    據(jù)報導(dǎo),把機(jī)器感測技術(shù)和生產(chǎn)設(shè)備相互集成,可以從各個層面大幅提升運(yùn)轉(zhuǎn)效率。
    發(fā)表于 10-20 08:48 ?630次閱讀

    Candence Virtuoso進(jìn)行基本的電路設(shè)計

    這篇博客記錄一下virtuoso中進(jìn)行CMOS反相器和靜態(tài)寄存器的電路設(shè)計以及功能仿真,適合入門。還做了版圖設(shè)計,但是自己對原理不是不清楚,在此就不記錄了。virtuoso電路設(shè)計環(huán)境基本教學(xué)一
    發(fā)表于 11-07 10:21 ?47次下載
    Candence <b class='flag-5'>Virtuoso</b>進(jìn)行基本的電路設(shè)計

    Virtuoso效率使用技巧(2)

    用過Verdi調(diào)試的小伙伴都知道verdi中可以選中一個信號,快速的找到信號的driver/load。雖然virtuoso schematic有probe, net-highlight功能,但是在
    的頭像 發(fā)表于 09-11 16:18 ?4014次閱讀
    <b class='flag-5'>Virtuoso</b>高<b class='flag-5'>效率</b>使用技巧(2)

    如何大幅提升汽車發(fā)動機(jī)的熱效率?

    有沒有什么辦法能讓發(fā)動機(jī)的熱效率大幅提升,如果能提升到一半甚至現(xiàn)有水平的一倍,燃油車的未來又會是什么樣子呢?
    發(fā)表于 09-12 11:12 ?735次閱讀
    如何<b class='flag-5'>大幅</b><b class='flag-5'>提升</b>汽車發(fā)動機(jī)的熱<b class='flag-5'>效率</b>?