EDA雲實證Vol.10：Auto-Scale這支仙女棒如何提升Virtuoso效率

這是我們EDA雲實證的第四期。

本期實證的主角是——Virtuoso。

半導體行業中使用範圍最廣的EDA應用之一。

1991年Virtuoso技術正式釋出，最初作為掩模設計師的版圖工具，是Opus平臺的一部分，

主要功能包括電路設計與模擬、版圖設計、設計驗證，以及模擬／數字混合設計等。

近30年來，Virtuoso產品已和最初有很大不同，但其核心仍然是版圖編輯器。

應用工具層面。Cadence一直致力於最佳化EDA應用演算法和效能，提高自動化水平，將

Virtuoso逐漸升級和擴充套件為集合多項新技術的系統設計平臺。

而

從應用到雲資源層，就由我們來發揮了

。

我們針對EDA應用雲原生適配，為

IC研發設計人員提供一整套即開即用，快速上手的IC研發設計環境，系統性大幅提升研發效率

。

我們到底是怎麼做到的？

研發效率具體提高在哪些方面？

什麼是即開即用的IC研發設計環境？好用嗎？改變原來習慣嗎？

以下是今天的正文：

使用者需求

某晶片設計公司做數模混合晶片，經常使用Virtuoso呼叫Spectre完成模擬任務，需要趕

MPW shuttle，

即將面臨

多專案同時進行、專案關鍵時間節點相同

的困境。

但

公司CEO並不想單純靠增加本地機器來解決目前問題，一方面考慮到會對企業造成比較大的現金流壓力，另一方面公司並沒有專門的IT和CAD團隊

。他對能不能用雲解決現有問題十分重視，也直接和雲廠商交流過，對我們的雲上自動化和Auto-Scale功能很感興趣。

實證目標

1、fastone平臺是否支援在雲端使用Virtuoso執行模擬任務？

2、透過平臺使用Virtuoso和本地差別大嗎？

3、Auto-Scale自動化伸縮具體怎麼實現的？

4、Slurm排程器行不行？

實證引數

平臺：

fastone企業版產品

應用：

Cadence Virtuoso

適用場景：

數模混合電路設計及模擬

雲端硬體配置：

Spectre模擬主要需要的是計算密集型CPU，所以平臺推薦的是計算最佳化型雲端例項

排程器：

Slurm（關於排程器，下文會詳細講解）

技術架構圖：

一整套即開即用的IC研發設計環境

操作像吃了德芙般順滑

使用者對於在本地單機使用Virtuoso執行模擬任務，已經非常熟悉。

而對於在雲上跑，使用者依然有以下疑問：

什麼叫一整套？從哪一步到哪一步？

雲上使用Virtuoso，操作方式會改變嗎？會不會很麻煩？

我們為使用者提供的產品，從登入桌面、開啟應用、配置模擬、提交任務、自動上雲開機執行任務並自動關機、檢視結果進行除錯……使用者所需要的操作與本地幾乎完全一致，每一步只需在平臺上使用滑鼠簡單點選即可完成。

我們說的“一整套”，就是這個意思。

至於操作方式會不會改變？

拿訪問叢集舉例。

使用者訪問叢集，既可以透過命令列，也可以透過WebVNC圖形介面方式直接訪問。

手動模式訪問叢集，一共有五步，

往往還需要請IT先配置環境

：

1、在雲端開一臺機器；

2、在雲端安裝VNC服務並進行配置，有幾個使用者使用就需要配置幾個賬號；

3、在本地安裝VNC服務並進行配置；

4、在雲端開啟VNC服務；

5、使用者使用各自賬號登入客戶端VNC訪問雲端。

我們為所有使用者

免費提供WebVNC功能，自動化建立到訪問叢集

：

1、透過Web瀏覽器登入fastone平臺；

2、在Web介面新建叢集、配置資源；

3、在已建立的叢集點選WebVNC遠端桌面圖示（同時提供WebSSH遠端命令列功能）；

4、跳轉到虛擬桌面，可在該桌面中操作Virtuoso。

我們還提供了統一的使用者認證，不同使用者可以直接訪問VNC，無需重新配置。

這種操作方式給使用者提供了熟悉的操作環境，使其能夠快速地遠端自動化訪問叢集，避免了大量的手動部署，使用體驗更好。

在資料傳輸上，我們同樣為使用者提供了不改變操作習慣的DM工具，使用者無需在多套認證系統之間切換，使用統一的身份認證即可傳輸資料，並自動關聯雲端叢集進行計算，具體看這裡《

CAE雲實證Vol。8：LS-DYNA求解效率深度測評

》

當然，好處遠遠不止這些。

Auto-Scale自動伸縮就像仙女棒

變大變小變漂亮

fastone透過Auto-Scale功能實現自動化建立叢集的過程，可以實現自動監控使用者提交的任務數量和資源的需求，動態按需地開啟所需算力資源，在提升效率的同時有效降低成本。

怎麼讓仙女棒發揮作用？

先來設定一下：

下圖就是

開啟Auto-Scale功能後，使用者某專案一週之內所呼叫雲端計算資源的動態情況。

其中橙色曲線為OD例項的使用狀況，紅色曲線為SPOT的使用狀況。

OD：On-Demand，按需例項。針對短期彈性需求，按小時計費，但價格比較高。

SPOT：可被搶佔例項，又稱競價例項。

價格最低可達到按需例項價格的10%

，相當於秒殺，手快有手慢無，隨時可能被搶佔中斷，需要有一定的技術實力才能使用。

兩個重點：

第一、從圖中可以看到整個階段算力波峰為約3500核，而波谷只有650核左右。使用者使用資源是存在明顯的波峰波谷週期的。

Auto-Scale功能可以根據任務運算情況動態開啟雲端資源，並在波峰過去後自動關閉，讓資源的使用隨著使用者的需求自動擴張及縮小，最大程度匹配任務需求。

當然，使用者也可以選擇自己對最大最小值進行設定，加以限制。

這一方面

節約了使用者成本，不需要時刻保持最高峰使用資源；

另一方面也最大限度

保證了任務最大效率執行。

比如跑100個corner的模擬，以前只能同時跑10個，要花10天，現在可以同時跑100個，只要1天就可以完成。這兩種方式成本相同，為使用者

節約出了顯著的時間差

，

大大縮短了任務執行週期，

提升了研發效率。

第二、我們的Auto-Scale功能

支援對不同計費模式（OD、SPOT）例項進行自動伸縮

，OD按需例項價格通常為SPOT例項的3-10倍。

Auto-Scale功能

可以根據不同的使用者策略，比如成本最優還是時間優先，自動化跨區、跨型別為使用者排程雲資源，完成計算任務

。

至於不同策略具體怎麼落地執行？相比時間優先策略，成本優先怎麼做到降低成本最多達67%-90%？在這篇實證《

生信雲實證Vol。3：提速2920倍！用AutoDock Vina對接2800萬個分子

》裡體現得十分明顯。

不僅限於執行任務期間，其實

早在建立叢集的時候，自動化Auto-Scale過程就已經開始了。

在這篇

Bladed實證

裡，fastone平臺在任務的不同階段採取不同的策略應對，除任務執行時間內全部雲資源滿負荷運作以外，在資料處理和結果資料上傳階段均只開啟了1-2臺機器，而其他準備過程不需要開啟機器。

習慣了LSF/SGE

Slurm排程器到底行不行？

為什麼選擇Slurm排程器？

Virtuoso應用原生支援的排程器有LSF和SGE。

LSF作為商業軟體，由IBM提供商業支援，是半導體行業最常用的排程器軟體。曾經衍生出的開源版Openlava在2016後IBM發起的版權訴訟之後，2018年正式被禁用。

SGE商業版在去年已經隨Univa被Altair收購。類似的，免費開源版已經長期無維護和更新，也存在版權風險。

LSF和SGE均按核時收費，價格不菲，如果在雲端大規模使用，價格驚人，而且都需要購買單獨的Resource Connector或Navops Launch產品才能支援在雲上使用。

而

Slurm作為排程器四大流派裡唯一的純開源派，就不受規模和費用的限制了

。而且Slurm擁有容錯率高、支援異構資源、高度可擴充套件等優點，每秒可提交超過1000個任務，且由於是開放框架，高度可配置，擁有超過100種外掛，因此適用性相當強。

所以我們優先選擇Slurm。

關於這四家主流排程器：LSF/SGE/Slurm/PBS以及它們的9個演化版本，可以看這篇文章《

億萬打工人的夢：16萬個CPU隨你用

》，我們進行了整體梳理和盤點，尤其是對雲的支援方面劃了重點。

我們是怎麼實現的？

答案是：SGE Wrapper。

Wrapper是什麼呢？

可以看看下圖，可以看到同樣的命令在不同的排程器之間有不同的實現方式：

而Wrapper就像不同調度器命令語言中的翻譯器，我們相當於透過這個翻譯器，把Slurm語言翻譯成了Virtuoso聽得懂的SGE語言，於是應用就能正常執行啦。

關於不同調度器的使用效果。

我們曾經在Proteus

OPC實證

場景四中分別使用SGE和Slurm在雲端和本地分別排程2000核/5000核執行相同OPC任務。

結論是：對於計算結果無影響。

關於排程器如何在多機器多工的情況下提升資源利用率，並進行自動化管理，可以看這篇《

EDA雲實證Vol。7：揭秘20000個VCS任務背後的“搬桌子”系列故事

》

任務監控還能搞出省錢大招？

根據我們對整個任務消耗資源狀態的監控，發現運算該組任務所使用的記憶體大部分時間在5G以下，但會有極短的一段時間（不超過半小時）達到17。5G。

從上圖中可以看到，Swap剩餘量在短時間內從8。6G跌到了7。1G，隨後很快回升到了8。38G，也就是說如果沒有Swap，執行記憶體的瞬時缺口約為1。5G，勢必造成任務失敗。

Swap，交換分割槽，就是在記憶體不夠的情況下，作業系統先把記憶體中暫時不用的資料，存到硬碟的交換空間，騰出記憶體來讓別的程式執行。

如果配置16G的記憶體，任務最後會因此失敗。

但如果選擇配置32G記憶體，著實有點浪費，畢竟也就超了一點點。

而同等CPU資源下，配備32G記憶體的價格普遍要比16G

貴1.4-1.9倍

。

正是由於完備的監控和任務效能評估機制，我們建議使用者在雲端運算時配備16G記憶體，同時使用Swap功能渡過這段記憶體波峰，以達到最高的價效比。

實證小結

1、fastone平臺支援在雲端使用Virtuoso呼叫Spectre執行模擬任務；

2、使用者使用這套研發設計環境能閉環完成Virtuoso執行任務，且基本不改變使用者習慣；

3、fastone平臺的雲上自動化模式和Auto-Scale功能能有效幫使用者縮短研發週期，同時降低使用成本；

4、Slurm排程器不會影響計算結果，是更具價效比及擴充套件性的選擇；

5、fastone平臺擁有完備的監控及任務效能評估機制。

本次EDA實證系列Vol。10就到這裡了。

下一期我們聊HFSS。

- END -

我們有個為應用定義的EDA雲平臺

整合多種EDA應用，大量任務多節點並行

應對短時間爆發性需求，連網即用

跑任務快，原來幾個月甚至幾年，現在只需幾小時

5分鐘快速上手，拖拉點選視覺化介面，無需程式碼

支援高階使用者直接在雲端建立叢集

現在免費試用，送300元體驗金，入股不虧~

更多電子書歡迎關注小F（ID：imfastone）獲取

你也許想了解具體的落地場景：

1分鐘告訴你用MOE模擬200000個分子要花多少錢

LS-DYNA求解效率深度測評 │ 六種規模，本地VS雲端5種不同硬體配置

揭秘20000個VCS任務背後的“搬桌子”系列故事

155個GPU！多雲場景下的Amber自由能計算

怎麼把需要45天的突發性Fluent模擬計算縮短到4天之內？

國內最大規模OPC上雲，5000核並行，效率提升53倍

提速2920倍！用AutoDock Vina對接2800萬個分子

從4天到1.75小時，如何讓Bladed模擬效率提升55倍？

從30天到17小時，如何讓HSPICE模擬效率提升42倍？

關於為應用定義的雲平臺：

速石科技獲元禾璞華領投數千萬美元B輪融資，深化打造為應用定義的雲

【大白話】帶你一次搞懂速石科技三大產品：FCC、FCC-E、FCP

AI太笨了……暫時

速石科技成三星Foundry國內首家SAFE雲合作伙伴

Ansys最新CAE調研報告找到阻礙模擬效率提升的“元兇”，竟然是Ta……

EDA雲平臺49問

幫助CXO解惑上雲成本的迷思，看這篇就夠了

花費4小時5500美元，速石科技躋身全球超算TOP500

速石科技（ID：Fastone_tech）

我們致力於構建為應用定義的雲，讓任何應用程式，始終以自動化、更最佳化和可擴充套件的方式，在任何基礎架構上執行。希望和你共同建立持續迭代的多雲世界觀。

說出你的應用，我們就有故事~~

（你要是嘮這個我就不困了。）