作為最早的電子設(shè)計(jì)自動(dòng)化軟件,我們的EDA云實(shí)證系列從SPICE開(kāi)始,再合適不過(guò)。
在它出現(xiàn)之前,人們分析電路,用的是紙筆或者搭電路板。隨著電路規(guī)模增大,手工明顯跟不上。
于是,1971年,SPICE誕生了。全稱(chēng)“Simulation Program with Integrates Circuit Emphasis"。
H-SPICE是隨著產(chǎn)業(yè)環(huán)境及電路設(shè)計(jì)技術(shù)的發(fā)展與升級(jí),以“SPICE2”為基礎(chǔ)加以改進(jìn)而成的商業(yè)軟件產(chǎn)品,現(xiàn)在屬于Synopsys。
既然有了新的計(jì)算機(jī)輔助工具,那問(wèn)題就來(lái)了:
怎么才能跑得更快一點(diǎn)?
怎么才能運(yùn)行更大規(guī)模的集成電路?
第一個(gè)答案是算法改進(jìn)。這屬于數(shù)學(xué)領(lǐng)域,很難。
第二個(gè)答案是摩爾定律。從上世紀(jì)70年代初到如今,SPICE從只能仿真十幾個(gè)元器件到今天可以仿真上千萬(wàn)個(gè)元器件的電路。但已經(jīng)幾十年沒(méi)有太大的變化了。
第三個(gè)答案是計(jì)算架構(gòu)升級(jí),從單核到多核,單線程到多線程。
第四個(gè)答案是Cloud HPC云端高性能計(jì)算。談概念過(guò)于抽象,我們今天拿實(shí)證說(shuō)話。
實(shí)證背景信息
用戶(hù)需求
作為一家純IC設(shè)計(jì)公司,C社成立已超過(guò)十年。
公司在本地部署了由十多臺(tái)機(jī)器組成的計(jì)算集群,但目前面臨的最大問(wèn)題依然是算力不足。特別是面對(duì)每年十次左右的算力高峰期時(shí),基本上沒(méi)有太好的辦法。
對(duì)云的認(rèn)知
C社相關(guān)負(fù)責(zé)人表示:算力不足是目前IC設(shè)計(jì)行業(yè)普遍面臨的問(wèn)題。對(duì)于EDA上云,公司之前沒(méi)有嘗試過(guò),對(duì)云模式和架構(gòu)也并不了解,在數(shù)據(jù)安全性方面也存在一定的顧慮。
不過(guò)該負(fù)責(zé)人對(duì)于EDA上云早有耳聞,也頗感興趣,愿意進(jìn)行一定的嘗試。畢竟上云若真的能夠加快運(yùn)算速度,就意味著可以更早展開(kāi)研究,從而提升項(xiàng)目的整體進(jìn)度。
實(shí)證目標(biāo)
1、HSPICE任務(wù)能否在云端運(yùn)行?
2、云端資源是否能適配HSPICE任務(wù)需求?
3、fastone平臺(tái)能否有效解決目前業(yè)務(wù)問(wèn)題?
4、相比傳統(tǒng)手動(dòng)模式,云端計(jì)算集群的自動(dòng)化部署,有哪些好處?
實(shí)證參數(shù)
平臺(tái):
fastone企業(yè)版產(chǎn)品
應(yīng)用:
HSPICE
適用場(chǎng)景:
仿真模擬電路、混合信號(hào)電路、精確數(shù)字電路、建立SoC的時(shí)序及功耗單元庫(kù)、分析系統(tǒng)級(jí)的信號(hào)完整性等
技術(shù)架構(gòu)圖:
用戶(hù)登錄VDI,使用fastone算力運(yùn)營(yíng)平臺(tái)根據(jù)實(shí)際計(jì)算需求自動(dòng)創(chuàng)建、銷(xiāo)毀集群,完成計(jì)算任務(wù)。
License配置:
EDA License Server設(shè)置在本地。
步驟一:硬件選擇
選擇適合HSPICE應(yīng)用的配置
云端可以選擇的機(jī)型有幾百種,配置、價(jià)格差異極大。
我們首先需要挑選出既能滿足HSPICE應(yīng)用需求,又具備性?xún)r(jià)比的機(jī)型。
已知用戶(hù)的本地硬件配置:
Xeon(R) Gold 6244 CPU @ 3.60GHz,512GB Memory
本地配置不僅主頻高,內(nèi)存也相當(dāng)大。
我們推薦的云端硬件配置:
96 vCPU, 3.6GHz, 2nd Gen Intel Xeon Platinum 8275CL, 192 GiB Memory
推薦理由:
1、該應(yīng)用對(duì)CPU主頻要求較高,但內(nèi)存要求并不大;
2、我們選擇了計(jì)算優(yōu)化型云端實(shí)例,即具備高性?xún)r(jià)比的高主頻機(jī)器。
C社的本地硬件在HSPICE以外,還需處理一些需要大內(nèi)存的后端任務(wù),所以需要在配置上兼顧各種資源需求,在當(dāng)前項(xiàng)目不可避免會(huì)造成一定的資源浪費(fèi)。
步驟二:云端部署
手動(dòng)模式 VS 自動(dòng)部署
我們先看手動(dòng)模式:
第一步:不管你需要用哪朵云,你都得先熟悉那家云的操作界面,掌握正確的使用方法;
第二步:構(gòu)建大規(guī)模算力集群:
配置計(jì)算節(jié)點(diǎn),存儲(chǔ)節(jié)點(diǎn),VPC,安全組等等
安裝應(yīng)用,把HSPICE安裝在集群環(huán)境
配置集群調(diào)度器,比如slurm
第三步:上傳任務(wù)數(shù)據(jù),開(kāi)啟計(jì)算;
第四步:任務(wù)完成后及時(shí)下載結(jié)果并關(guān)機(jī)。
不要笑,這一點(diǎn)很重要。我們?cè)谇袚Q七種視角,我們給各位CXO大佬算算上云這筆賬有講到原因。
此外,還有一個(gè)需要考慮的點(diǎn),時(shí)間。
第一步,需要多少時(shí)間說(shuō)不好;
第二步,大概需要專(zhuān)業(yè)IT人員平均3-5天;
第三步/第四步,如果數(shù)據(jù)量較大,需要考慮斷點(diǎn)續(xù)傳和自動(dòng)重傳;
第四步,任務(wù)完成時(shí)間很可能難以預(yù)測(cè)。
即使是可測(cè)的,我們可以想象一個(gè)場(chǎng)景——有個(gè)任務(wù)預(yù)計(jì)在凌晨跑完,用戶(hù)此時(shí)有兩個(gè)選擇:
1、調(diào)一個(gè)鬧鐘,半夜起來(lái)關(guān)機(jī)——有人遭罪;
2、睡到自然醒,次日上班關(guān)機(jī)——成本浪費(fèi)。
在手動(dòng)模式下,通常都是先構(gòu)建一個(gè)固定規(guī)模的集群,然后提交任務(wù),全部任務(wù)結(jié)束后,關(guān)閉集群。
想一下一個(gè)幾千core的集群拉起來(lái)之后,第二、三、四步手動(dòng)配置的時(shí)間里,所有機(jī)器一直都是開(kāi)啟狀態(tài),也就是說(shuō),燒錢(qián)中。
再看看我們的自動(dòng)化部署:
第一步,不需要;
第二步,只需要點(diǎn)擊幾個(gè)按鈕,5-10分鐘即可開(kāi)啟集群;
第三步,我們有Auto-Scale功能,自動(dòng)開(kāi)關(guān)機(jī)。
另外,我們還自帶資源的管理和監(jiān)控功能。
fastone的Auto-Scale功能可以自動(dòng)監(jiān)控用戶(hù)提交的任務(wù)數(shù)量和資源的需求,動(dòng)態(tài)按需地開(kāi)啟所需算力資源,在提升效率的同時(shí)有效降低成本。
所有操作都是自動(dòng)化完成,無(wú)需用戶(hù)干預(yù);
在實(shí)際開(kāi)機(jī)過(guò)程中,可能遇到云在某個(gè)可用區(qū)資源不足的情況,fastone會(huì)自動(dòng)嘗試從別的區(qū)域開(kāi)啟資源;
如果需要的資源確實(shí)不夠,又急需算力完成任務(wù),用戶(hù)還可以從fastone界面選擇配置接近的實(shí)例類(lèi)型來(lái)補(bǔ)充。
跨區(qū)域,跨機(jī)型使用,在本次實(shí)證場(chǎng)景沒(méi)有用到。
我們還可以根據(jù)GPU的需求來(lái)實(shí)現(xiàn)自動(dòng)伸縮,下次單獨(dú)聊。
實(shí)證場(chǎng)景一:云端驗(yàn)證
本地40核 VS 云端40核 VS云端80核
結(jié)論:
1、當(dāng)計(jì)算資源與任務(wù)拆分方式均為5*8核時(shí),本地和云端的計(jì)算周期基本一致;
2、在云端將任務(wù)拆分為10*4核后,比5*8核的拆分方式計(jì)算周期減少三分之一;
3、當(dāng)任務(wù)拆分方式不變,計(jì)算資源從40核增加到80核,計(jì)算周期減半;
4、當(dāng)計(jì)算資源翻倍,且任務(wù)拆分方式從5*8核變更為10*4核后,計(jì)算周期減少三分之二;
5、fastone自動(dòng)化部署可大幅節(jié)省用戶(hù)的時(shí)間和人力成本。
實(shí)證過(guò)程:
1、本地使用40核計(jì)算資源,拆分為5*8核,運(yùn)行編號(hào)為1的HSPICE任務(wù),耗時(shí)42小時(shí);
2、云端調(diào)度40核計(jì)算資源,拆分為5*8核,運(yùn)行編號(hào)為1的HSPICE任務(wù),耗時(shí)42小時(shí);
3、云端調(diào)度40核計(jì)算資源,拆分為10*4核,運(yùn)行編號(hào)為1的HSPICE任務(wù),耗時(shí)28小時(shí);
4、云端調(diào)度80核計(jì)算資源,拆分為10*8核,運(yùn)行編號(hào)為1的HSPICE任務(wù),耗時(shí)21小時(shí);
5、云端調(diào)度80核計(jì)算資源,拆分為20*4核,運(yùn)行編號(hào)為1的HSPICE任務(wù),耗時(shí)14小時(shí)。
實(shí)證場(chǎng)景二:大規(guī)模業(yè)務(wù)驗(yàn)證
超大規(guī)模計(jì)算任務(wù)
結(jié)論:
1、增加計(jì)算資源并優(yōu)化任務(wù)拆分方式后,云端調(diào)度1920核計(jì)算資源,將一組超大規(guī)模計(jì)算任務(wù)(共計(jì)24個(gè)HSPICE任務(wù))的計(jì)算周期從原有的30天縮短至17小時(shí)即可完成,云端最優(yōu)計(jì)算周期與本地計(jì)算周期相比,效率提升42倍;
2、由fastone平臺(tái)自研的Auto-Scale功能,使平臺(tái)可根據(jù)HSPICE任務(wù)狀態(tài)在云端自動(dòng)化構(gòu)建計(jì)算集群,并根據(jù)實(shí)際需求自動(dòng)伸縮,計(jì)算完成后自動(dòng)銷(xiāo)毀,在提升效率的同時(shí)有效降低成本;
3、隨著計(jì)算周期的縮短,設(shè)備斷電、應(yīng)用崩潰等風(fēng)險(xiǎn)也相應(yīng)降低,作業(yè)中斷的風(fēng)險(xiǎn)也大大降低。在本實(shí)例中未發(fā)生作業(yè)中斷。
實(shí)證過(guò)程:
1、本地使用40核計(jì)算資源,拆分為5*8核,運(yùn)行編號(hào)從0到23共計(jì)24個(gè)HSPICE任務(wù),耗時(shí)約30天;
2、云端調(diào)度1920核計(jì)算資源,拆分為24組,每組為20*4核,運(yùn)行編號(hào)從0到23共計(jì)24個(gè)HSPICE任務(wù),耗時(shí)17個(gè)小時(shí)。
實(shí)證小結(jié)
我們回顧一下實(shí)證目標(biāo):
1、HSPICE任務(wù)在云端能高效運(yùn)行;
2、異構(gòu)的云端資源能更好適配HSPICE任務(wù)需求,避免資源浪費(fèi);
3、fastone平臺(tái)有效解決了算力不足問(wèn)題,效率提升42倍;
4、相比手動(dòng)模式,fastone平臺(tái)自研的Auto-Scale功能,既能有效提升部署效率,降低部署門(mén)檻,又能大大縮短整個(gè)計(jì)算周期資源占用率,節(jié)約成本。
至于本次實(shí)證場(chǎng)景沒(méi)用到的跨區(qū)域,跨機(jī)型使用,還有根據(jù)GPU的需求來(lái)實(shí)現(xiàn)自動(dòng)伸縮,我們下次再聊。
本次半導(dǎo)體行業(yè)Cloud HPC實(shí)證系列Vol.1就到這里了。
審核編輯 :李倩
-
仿真
+關(guān)注
關(guān)注
50文章
4124瀏覽量
133997 -
hspice
+關(guān)注
關(guān)注
6文章
30瀏覽量
24294 -
自動(dòng)化軟件
+關(guān)注
關(guān)注
0文章
20瀏覽量
6033
原文標(biāo)題:從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
文章出處:【微信號(hào):FPGA_Study,微信公眾號(hào):FPGA自習(xí)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論