EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

這是我們EDA雲實證的第四期。

本期實證的主角是——Virtuoso。

半導體行業中使用範圍最廣的EDA應用之一。

1991年Virtuoso技術正式釋出,最初作為掩模設計師的版圖工具,是Opus平臺的一部分,

主要功能包括電路設計與模擬、版圖設計、設計驗證,以及模擬/數字混合設計等。

近30年來,Virtuoso產品已和最初有很大不同,但其核心仍然是版圖編輯器。

應用工具層面。Cadence一直致力於最佳化EDA應用演算法和效能,提高自動化水平,將

Virtuoso逐漸升級和擴充套件為集合多項新技術的系統設計平臺。

從應用到雲資源層,就由我們來發揮了

我們針對EDA應用雲原生適配,為

IC研發設計人員提供一整套即開即用,快速上手的IC研發設計環境,系統性大幅提升研發效率

我們到底是怎麼做到的?

研發效率具體提高在哪些方面?

什麼是即開即用的IC研發設計環境?好用嗎?改變原來習慣嗎?

以下是今天的正文:

使用者需求

某晶片設計公司做數模混合晶片,經常使用Virtuoso呼叫Spectre完成模擬任務,需要趕

MPW shuttle,

即將面臨

多專案同時進行、專案關鍵時間節點相同

的困境。

公司CEO並不想單純靠增加本地機器來解決目前問題,一方面考慮到會對企業造成比較大的現金流壓力,另一方面公司並沒有專門的IT和CAD團隊

。他對能不能用雲解決現有問題十分重視,也直接和雲廠商交流過,對我們的雲上自動化和Auto-Scale功能很感興趣。

實證目標

1、fastone平臺是否支援在雲端使用Virtuoso執行模擬任務?

2、透過平臺使用Virtuoso和本地差別大嗎?

3、Auto-Scale自動化伸縮具體怎麼實現的?

4、Slurm排程器行不行?

實證引數

平臺:

fastone企業版產品

應用:

Cadence Virtuoso

適用場景:

數模混合電路設計及模擬

雲端硬體配置:

Spectre模擬主要需要的是計算密集型CPU,所以平臺推薦的是計算最佳化型雲端例項

排程器:

Slurm(關於排程器,下文會詳細講解)

技術架構圖:

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

一整套即開即用的IC研發設計環境

操作像吃了德芙般順滑

使用者對於在本地單機使用Virtuoso執行模擬任務,已經非常熟悉。

而對於在雲上跑,使用者依然有以下疑問:

什麼叫一整套?從哪一步到哪一步?

雲上使用Virtuoso,操作方式會改變嗎?會不會很麻煩?

我們為使用者提供的產品,從登入桌面、開啟應用、配置模擬、提交任務、自動上雲開機執行任務並自動關機、檢視結果進行除錯……使用者所需要的操作與本地幾乎完全一致,每一步只需在平臺上使用滑鼠簡單點選即可完成。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

我們說的“一整套”,就是這個意思。

至於操作方式會不會改變?

拿訪問叢集舉例。

使用者訪問叢集,既可以透過命令列,也可以透過WebVNC圖形介面方式直接訪問。

手動模式訪問叢集,一共有五步,

往往還需要請IT先配置環境

1、在雲端開一臺機器;

2、在雲端安裝VNC服務並進行配置,有幾個使用者使用就需要配置幾個賬號;

3、在本地安裝VNC服務並進行配置;

4、在雲端開啟VNC服務;

5、使用者使用各自賬號登入客戶端VNC訪問雲端。

我們為所有使用者

免費提供WebVNC功能,自動化建立到訪問叢集

1、透過Web瀏覽器登入fastone平臺;

2、在Web介面新建叢集、配置資源;

3、在已建立的叢集點選WebVNC遠端桌面圖示(同時提供WebSSH遠端命令列功能);

4、跳轉到虛擬桌面,可在該桌面中操作Virtuoso。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

我們還提供了統一的使用者認證,不同使用者可以直接訪問VNC,無需重新配置。

這種操作方式給使用者提供了熟悉的操作環境,使其能夠快速地遠端自動化訪問叢集,避免了大量的手動部署,使用體驗更好。

在資料傳輸上,我們同樣為使用者提供了不改變操作習慣的DM工具,使用者無需在多套認證系統之間切換,使用統一的身份認證即可傳輸資料,並自動關聯雲端叢集進行計算,具體看這裡《

CAE雲實證Vol。8:LS-DYNA求解效率深度測評

當然,好處遠遠不止這些。

Auto-Scale自動伸縮就像仙女棒

變大變小變漂亮

fastone透過Auto-Scale功能實現自動化建立叢集的過程,可以實現自動監控使用者提交的任務數量和資源的需求,動態按需地開啟所需算力資源,在提升效率的同時有效降低成本。

怎麼讓仙女棒發揮作用?

先來設定一下:

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

下圖就是

開啟Auto-Scale功能後,使用者某專案一週之內所呼叫雲端計算資源的動態情況。

其中橙色曲線為OD例項的使用狀況,紅色曲線為SPOT的使用狀況。

OD:On-Demand,按需例項。針對短期彈性需求,按小時計費,但價格比較高。

SPOT:可被搶佔例項,又稱競價例項。

價格最低可達到按需例項價格的10%

,相當於秒殺,手快有手慢無,隨時可能被搶佔中斷,需要有一定的技術實力才能使用。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

兩個重點:

第一、從圖中可以看到整個階段算力波峰為約3500核,而波谷只有650核左右。使用者使用資源是存在明顯的波峰波谷週期的。

Auto-Scale功能可以根據任務運算情況動態開啟雲端資源,並在波峰過去後自動關閉,讓資源的使用隨著使用者的需求自動擴張及縮小,最大程度匹配任務需求。

當然,使用者也可以選擇自己對最大最小值進行設定,加以限制。

這一方面

節約了使用者成本,不需要時刻保持最高峰使用資源;

另一方面也最大限度

保證了任務最大效率執行。

比如跑100個corner的模擬,以前只能同時跑10個,要花10天,現在可以同時跑100個,只要1天就可以完成。這兩種方式成本相同,為使用者

節約出了顯著的時間差

大大縮短了任務執行週期,

提升了研發效率。

第二、我們的Auto-Scale功能

支援對不同計費模式(OD、SPOT)例項進行自動伸縮

,OD按需例項價格通常為SPOT例項的3-10倍。

Auto-Scale功能

可以根據不同的使用者策略,比如成本最優還是時間優先,自動化跨區、跨型別為使用者排程雲資源,完成計算任務

至於不同策略具體怎麼落地執行?相比時間優先策略,成本優先怎麼做到降低成本最多達67%-90%?在這篇實證《

生信雲實證Vol。3:提速2920倍!用AutoDock Vina對接2800萬個分子

》裡體現得十分明顯。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

不僅限於執行任務期間,其實

早在建立叢集的時候,自動化Auto-Scale過程就已經開始了。

在這篇

Bladed實證

裡,fastone平臺在任務的不同階段採取不同的策略應對,除任務執行時間內全部雲資源滿負荷運作以外,在資料處理和結果資料上傳階段均只開啟了1-2臺機器,而其他準備過程不需要開啟機器。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

習慣了LSF/SGE

Slurm排程器到底行不行?

為什麼選擇Slurm排程器?

Virtuoso應用原生支援的排程器有LSF和SGE。

LSF作為商業軟體,由IBM提供商業支援,是半導體行業最常用的排程器軟體。曾經衍生出的開源版Openlava在2016後IBM發起的版權訴訟之後,2018年正式被禁用。

SGE商業版在去年已經隨Univa被Altair收購。類似的,免費開源版已經長期無維護和更新,也存在版權風險。

LSF和SGE均按核時收費,價格不菲,如果在雲端大規模使用,價格驚人,而且都需要購買單獨的Resource Connector或Navops Launch產品才能支援在雲上使用。

Slurm作為排程器四大流派裡唯一的純開源派,就不受規模和費用的限制了

。而且Slurm擁有容錯率高、支援異構資源、高度可擴充套件等優點,每秒可提交超過1000個任務,且由於是開放框架,高度可配置,擁有超過100種外掛,因此適用性相當強。

所以我們優先選擇Slurm。

關於這四家主流排程器:LSF/SGE/Slurm/PBS以及它們的9個演化版本,可以看這篇文章《

億萬打工人的夢:16萬個CPU隨你用

》,我們進行了整體梳理和盤點,尤其是對雲的支援方面劃了重點。

我們是怎麼實現的?

答案是:SGE Wrapper。

Wrapper是什麼呢?

可以看看下圖,可以看到同樣的命令在不同的排程器之間有不同的實現方式:

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

而Wrapper就像不同調度器命令語言中的翻譯器,我們相當於透過這個翻譯器,把Slurm語言翻譯成了Virtuoso聽得懂的SGE語言,於是應用就能正常執行啦。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

關於不同調度器的使用效果。

我們曾經在Proteus

OPC實證

場景四中分別使用SGE和Slurm在雲端和本地分別排程2000核/5000核執行相同OPC任務。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

結論是:對於計算結果無影響。

關於排程器如何在多機器多工的情況下提升資源利用率,並進行自動化管理,可以看這篇《

EDA雲實證Vol。7:揭秘20000個VCS任務背後的“搬桌子”系列故事

任務監控還能搞出省錢大招?

根據我們對整個任務消耗資源狀態的監控,發現運算該組任務所使用的記憶體大部分時間在5G以下,但會有極短的一段時間(不超過半小時)達到17。5G。

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

從上圖中可以看到,Swap剩餘量在短時間內從8。6G跌到了7。1G,隨後很快回升到了8。38G,也就是說如果沒有Swap,執行記憶體的瞬時缺口約為1。5G,勢必造成任務失敗。

Swap,交換分割槽,就是在記憶體不夠的情況下,作業系統先把記憶體中暫時不用的資料,存到硬碟的交換空間,騰出記憶體來讓別的程式執行。

如果配置16G的記憶體,任務最後會因此失敗。

但如果選擇配置32G記憶體,著實有點浪費,畢竟也就超了一點點。

而同等CPU資源下,配備32G記憶體的價格普遍要比16G

貴1.4-1.9倍

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率

正是由於完備的監控和任務效能評估機制,我們建議使用者在雲端運算時配備16G記憶體,同時使用Swap功能渡過這段記憶體波峰,以達到最高的價效比。

實證小結

1、fastone平臺支援在雲端使用Virtuoso呼叫Spectre執行模擬任務;

2、使用者使用這套研發設計環境能閉環完成Virtuoso執行任務,且基本不改變使用者習慣;

3、fastone平臺的雲上自動化模式和Auto-Scale功能能有效幫使用者縮短研發週期,同時降低使用成本;

4、Slurm排程器不會影響計算結果,是更具價效比及擴充套件性的選擇;

5、fastone平臺擁有完備的監控及任務效能評估機制。

本次EDA實證系列Vol。10就到這裡了。

下一期我們聊HFSS。

- END -

我們有個為應用定義的EDA雲平臺

整合多種EDA應用,大量任務多節點並行

應對短時間爆發性需求,連網即用

跑任務快,原來幾個月甚至幾年,現在只需幾小時

5分鐘快速上手,拖拉點選視覺化介面,無需程式碼

支援高階使用者直接在雲端建立叢集

現在免費試用,送300元體驗金,入股不虧~

更多電子書歡迎關注小F(ID:imfastone)獲取

你也許想了解具體的落地場景:

1分鐘告訴你用MOE模擬200000個分子要花多少錢

LS-DYNA求解效率深度測評 │ 六種規模,本地VS雲端5種不同硬體配置

揭秘20000個VCS任務背後的“搬桌子”系列故事

155個GPU!多雲場景下的Amber自由能計算

怎麼把需要45天的突發性Fluent模擬計算縮短到4天之內?

國內最大規模OPC上雲,5000核並行,效率提升53倍

提速2920倍!用AutoDock Vina對接2800萬個分子

從4天到1.75小時,如何讓Bladed模擬效率提升55倍?

從30天到17小時,如何讓HSPICE模擬效率提升42倍?

關於為應用定義的雲平臺:

速石科技獲元禾璞華領投數千萬美元B輪融資,深化打造為應用定義的雲

【大白話】帶你一次搞懂速石科技三大產品:FCC、FCC-E、FCP

AI太笨了……暫時

速石科技成三星Foundry國內首家SAFE雲合作伙伴

Ansys最新CAE調研報告找到阻礙模擬效率提升的“元兇”,竟然是Ta……

EDA雲平臺49問

幫助CXO解惑上雲成本的迷思,看這篇就夠了

花費4小時5500美元,速石科技躋身全球超算TOP500

速石科技(ID:Fastone_tech)

我們致力於構建為應用定義的雲,讓任何應用程式,始終以自動化、更最佳化和可擴充套件的方式,在任何基礎架構上執行。希望和你共同建立持續迭代的多雲世界觀。

說出你的應用,我們就有故事~~

(你要是嘮這個我就不困了。)

EDA雲實證Vol.10:Auto-Scale這支仙女棒如何提升Virtuoso效率