這是我們EDA雲實證的第四期。
本期實證的主角是——Virtuoso。
半導體行業中使用範圍最廣的EDA應用之一。
1991年Virtuoso技術正式釋出,最初作為掩模設計師的版圖工具,是Opus平臺的一部分,
主要功能包括電路設計與模擬、版圖設計、設計驗證,以及模擬/數字混合設計等。
近30年來,Virtuoso產品已和最初有很大不同,但其核心仍然是版圖編輯器。
應用工具層面。Cadence一直致力於最佳化EDA應用演算法和效能,提高自動化水平,將
Virtuoso逐漸升級和擴充套件為集合多項新技術的系統設計平臺。
而
從應用到雲資源層,就由我們來發揮了
。
我們針對EDA應用雲原生適配,為
IC研發設計人員提供一整套即開即用,快速上手的IC研發設計環境,系統性大幅提升研發效率
。
我們到底是怎麼做到的?
研發效率具體提高在哪些方面?
什麼是即開即用的IC研發設計環境?好用嗎?改變原來習慣嗎?
以下是今天的正文:
使用者需求
某晶片設計公司做數模混合晶片,經常使用Virtuoso呼叫Spectre完成模擬任務,需要趕
MPW shuttle,
即將面臨
多專案同時進行、專案關鍵時間節點相同
的困境。
但
公司CEO並不想單純靠增加本地機器來解決目前問題,一方面考慮到會對企業造成比較大的現金流壓力,另一方面公司並沒有專門的IT和CAD團隊
。他對能不能用雲解決現有問題十分重視,也直接和雲廠商交流過,對我們的雲上自動化和Auto-Scale功能很感興趣。
實證目標
1、fastone平臺是否支援在雲端使用Virtuoso執行模擬任務?
2、透過平臺使用Virtuoso和本地差別大嗎?
3、Auto-Scale自動化伸縮具體怎麼實現的?
4、Slurm排程器行不行?
實證引數
平臺:
fastone企業版產品
應用:
Cadence Virtuoso
適用場景:
數模混合電路設計及模擬
雲端硬體配置:
Spectre模擬主要需要的是計算密集型CPU,所以平臺推薦的是計算最佳化型雲端例項
排程器:
Slurm(關於排程器,下文會詳細講解)
技術架構圖:
一整套即開即用的IC研發設計環境
操作像吃了德芙般順滑
使用者對於在本地單機使用Virtuoso執行模擬任務,已經非常熟悉。
而對於在雲上跑,使用者依然有以下疑問:
什麼叫一整套?從哪一步到哪一步?
雲上使用Virtuoso,操作方式會改變嗎?會不會很麻煩?
我們為使用者提供的產品,從登入桌面、開啟應用、配置模擬、提交任務、自動上雲開機執行任務並自動關機、檢視結果進行除錯……使用者所需要的操作與本地幾乎完全一致,每一步只需在平臺上使用滑鼠簡單點選即可完成。
我們說的“一整套”,就是這個意思。
至於操作方式會不會改變?
拿訪問叢集舉例。
使用者訪問叢集,既可以透過命令列,也可以透過WebVNC圖形介面方式直接訪問。
手動模式訪問叢集,一共有五步,
往往還需要請IT先配置環境
:
1、在雲端開一臺機器;
2、在雲端安裝VNC服務並進行配置,有幾個使用者使用就需要配置幾個賬號;
3、在本地安裝VNC服務並進行配置;
4、在雲端開啟VNC服務;
5、使用者使用各自賬號登入客戶端VNC訪問雲端。
我們為所有使用者
免費提供WebVNC功能,自動化建立到訪問叢集
:
1、透過Web瀏覽器登入fastone平臺;
2、在Web介面新建叢集、配置資源;
3、在已建立的叢集點選WebVNC遠端桌面圖示(同時提供WebSSH遠端命令列功能);
4、跳轉到虛擬桌面,可在該桌面中操作Virtuoso。
我們還提供了統一的使用者認證,不同使用者可以直接訪問VNC,無需重新配置。
這種操作方式給使用者提供了熟悉的操作環境,使其能夠快速地遠端自動化訪問叢集,避免了大量的手動部署,使用體驗更好。
在資料傳輸上,我們同樣為使用者提供了不改變操作習慣的DM工具,使用者無需在多套認證系統之間切換,使用統一的身份認證即可傳輸資料,並自動關聯雲端叢集進行計算,具體看這裡《
CAE雲實證Vol。8:LS-DYNA求解效率深度測評
》
當然,好處遠遠不止這些。
Auto-Scale自動伸縮就像仙女棒
變大變小變漂亮
fastone透過Auto-Scale功能實現自動化建立叢集的過程,可以實現自動監控使用者提交的任務數量和資源的需求,動態按需地開啟所需算力資源,在提升效率的同時有效降低成本。
怎麼讓仙女棒發揮作用?
先來設定一下:
下圖就是
開啟Auto-Scale功能後,使用者某專案一週之內所呼叫雲端計算資源的動態情況。
其中橙色曲線為OD例項的使用狀況,紅色曲線為SPOT的使用狀況。
OD:On-Demand,按需例項。針對短期彈性需求,按小時計費,但價格比較高。
SPOT:可被搶佔例項,又稱競價例項。
價格最低可達到按需例項價格的10%
,相當於秒殺,手快有手慢無,隨時可能被搶佔中斷,需要有一定的技術實力才能使用。
兩個重點:
第一、從圖中可以看到整個階段算力波峰為約3500核,而波谷只有650核左右。使用者使用資源是存在明顯的波峰波谷週期的。
Auto-Scale功能可以根據任務運算情況動態開啟雲端資源,並在波峰過去後自動關閉,讓資源的使用隨著使用者的需求自動擴張及縮小,最大程度匹配任務需求。
當然,使用者也可以選擇自己對最大最小值進行設定,加以限制。
這一方面
節約了使用者成本,不需要時刻保持最高峰使用資源;
另一方面也最大限度
保證了任務最大效率執行。
比如跑100個corner的模擬,以前只能同時跑10個,要花10天,現在可以同時跑100個,只要1天就可以完成。這兩種方式成本相同,為使用者
節約出了顯著的時間差
,
大大縮短了任務執行週期,
提升了研發效率。
第二、我們的Auto-Scale功能
支援對不同計費模式(OD、SPOT)例項進行自動伸縮
,OD按需例項價格通常為SPOT例項的3-10倍。
Auto-Scale功能
可以根據不同的使用者策略,比如成本最優還是時間優先,自動化跨區、跨型別為使用者排程雲資源,完成計算任務
。
至於不同策略具體怎麼落地執行?相比時間優先策略,成本優先怎麼做到降低成本最多達67%-90%?在這篇實證《
生信雲實證Vol。3:提速2920倍!用AutoDock Vina對接2800萬個分子
》裡體現得十分明顯。
不僅限於執行任務期間,其實
早在建立叢集的時候,自動化Auto-Scale過程就已經開始了。
在這篇
Bladed實證
裡,fastone平臺在任務的不同階段採取不同的策略應對,除任務執行時間內全部雲資源滿負荷運作以外,在資料處理和結果資料上傳階段均只開啟了1-2臺機器,而其他準備過程不需要開啟機器。
習慣了LSF/SGE
Slurm排程器到底行不行?
為什麼選擇Slurm排程器?
Virtuoso應用原生支援的排程器有LSF和SGE。
LSF作為商業軟體,由IBM提供商業支援,是半導體行業最常用的排程器軟體。曾經衍生出的開源版Openlava在2016後IBM發起的版權訴訟之後,2018年正式被禁用。
SGE商業版在去年已經隨Univa被Altair收購。類似的,免費開源版已經長期無維護和更新,也存在版權風險。
LSF和SGE均按核時收費,價格不菲,如果在雲端大規模使用,價格驚人,而且都需要購買單獨的Resource Connector或Navops Launch產品才能支援在雲上使用。
而
Slurm作為排程器四大流派裡唯一的純開源派,就不受規模和費用的限制了
。而且Slurm擁有容錯率高、支援異構資源、高度可擴充套件等優點,每秒可提交超過1000個任務,且由於是開放框架,高度可配置,擁有超過100種外掛,因此適用性相當強。
所以我們優先選擇Slurm。
關於這四家主流排程器:LSF/SGE/Slurm/PBS以及它們的9個演化版本,可以看這篇文章《
億萬打工人的夢:16萬個CPU隨你用
》,我們進行了整體梳理和盤點,尤其是對雲的支援方面劃了重點。
我們是怎麼實現的?
答案是:SGE Wrapper。
Wrapper是什麼呢?
可以看看下圖,可以看到同樣的命令在不同的排程器之間有不同的實現方式:
而Wrapper就像不同調度器命令語言中的翻譯器,我們相當於透過這個翻譯器,把Slurm語言翻譯成了Virtuoso聽得懂的SGE語言,於是應用就能正常執行啦。
關於不同調度器的使用效果。
我們曾經在Proteus
OPC實證
場景四中分別使用SGE和Slurm在雲端和本地分別排程2000核/5000核執行相同OPC任務。
結論是:對於計算結果無影響。
關於排程器如何在多機器多工的情況下提升資源利用率,並進行自動化管理,可以看這篇《
EDA雲實證Vol。7:揭秘20000個VCS任務背後的“搬桌子”系列故事
》
任務監控還能搞出省錢大招?
根據我們對整個任務消耗資源狀態的監控,發現運算該組任務所使用的記憶體大部分時間在5G以下,但會有極短的一段時間(不超過半小時)達到17。5G。
從上圖中可以看到,Swap剩餘量在短時間內從8。6G跌到了7。1G,隨後很快回升到了8。38G,也就是說如果沒有Swap,執行記憶體的瞬時缺口約為1。5G,勢必造成任務失敗。
Swap,交換分割槽,就是在記憶體不夠的情況下,作業系統先把記憶體中暫時不用的資料,存到硬碟的交換空間,騰出記憶體來讓別的程式執行。
如果配置16G的記憶體,任務最後會因此失敗。
但如果選擇配置32G記憶體,著實有點浪費,畢竟也就超了一點點。
而同等CPU資源下,配備32G記憶體的價格普遍要比16G
貴1.4-1.9倍
。
正是由於完備的監控和任務效能評估機制,我們建議使用者在雲端運算時配備16G記憶體,同時使用Swap功能渡過這段記憶體波峰,以達到最高的價效比。
實證小結
1、fastone平臺支援在雲端使用Virtuoso呼叫Spectre執行模擬任務;
2、使用者使用這套研發設計環境能閉環完成Virtuoso執行任務,且基本不改變使用者習慣;
3、fastone平臺的雲上自動化模式和Auto-Scale功能能有效幫使用者縮短研發週期,同時降低使用成本;
4、Slurm排程器不會影響計算結果,是更具價效比及擴充套件性的選擇;
5、fastone平臺擁有完備的監控及任務效能評估機制。
本次EDA實證系列Vol。10就到這裡了。
下一期我們聊HFSS。
- END -
我們有個為應用定義的EDA雲平臺
整合多種EDA應用,大量任務多節點並行
應對短時間爆發性需求,連網即用
跑任務快,原來幾個月甚至幾年,現在只需幾小時
5分鐘快速上手,拖拉點選視覺化介面,無需程式碼
支援高階使用者直接在雲端建立叢集
現在免費試用,送300元體驗金,入股不虧~
更多電子書歡迎關注小F(ID:imfastone)獲取
你也許想了解具體的落地場景:
1分鐘告訴你用MOE模擬200000個分子要花多少錢
LS-DYNA求解效率深度測評 │ 六種規模,本地VS雲端5種不同硬體配置
揭秘20000個VCS任務背後的“搬桌子”系列故事
155個GPU!多雲場景下的Amber自由能計算
怎麼把需要45天的突發性Fluent模擬計算縮短到4天之內?
國內最大規模OPC上雲,5000核並行,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子
從4天到1.75小時,如何讓Bladed模擬效率提升55倍?
從30天到17小時,如何讓HSPICE模擬效率提升42倍?
關於為應用定義的雲平臺:
速石科技獲元禾璞華領投數千萬美元B輪融資,深化打造為應用定義的雲
【大白話】帶你一次搞懂速石科技三大產品:FCC、FCC-E、FCP
AI太笨了……暫時
速石科技成三星Foundry國內首家SAFE雲合作伙伴
Ansys最新CAE調研報告找到阻礙模擬效率提升的“元兇”,竟然是Ta……
EDA雲平臺49問
幫助CXO解惑上雲成本的迷思,看這篇就夠了
花費4小時5500美元,速石科技躋身全球超算TOP500
速石科技(ID:Fastone_tech)
我們致力於構建為應用定義的雲,讓任何應用程式,始終以自動化、更最佳化和可擴充套件的方式,在任何基礎架構上執行。希望和你共同建立持續迭代的多雲世界觀。
說出你的應用,我們就有故事~~
(你要是嘮這個我就不困了。)