在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強大功能為超級計算機(jī)提供強大助力。
美國洛斯阿拉莫斯國家實驗室(LANL)正在與 NVIDIA 進(jìn)行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
面向 DPU 的開放式 API
這些努力還將有助于進(jìn)一步定義 OpenSNAPI ,任何人都可通過該應(yīng)用接口來控制 DPU 。這是統(tǒng)計計算框架(Unified Communication Framework)的一個項目,Unified Communication Framework 是一個旨在實現(xiàn) HPC 應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實驗室和美國的一些大學(xué)。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率。”
德克薩斯州打造出云原生超級計算平臺
德克薩斯高級計算中心(TACC)近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2 。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計算的開發(fā)平臺。
TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
MPI 獲得加速
在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。
他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了 P3DFFT ,這是一個用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。
俄亥俄州立大學(xué)計算機(jī)科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團(tuán)隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負(fù)載。”
HPC 中心和云中的 DPU
對于運行藥物研發(fā)或飛機(jī)設(shè)計等 HPC 仿真應(yīng)用的超級計算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個 HPC 中心的代碼請求。
Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而 InfiniBand 已經(jīng)在為它提供支持。”
達(dá)勒姆開發(fā)負(fù)載均衡
歐洲的多個研究團(tuán)隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。
例如,英格蘭北部的達(dá)勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個節(jié)點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現(xiàn) MPI 作業(yè)的負(fù)載均衡。該項目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。
劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用
劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU 。
倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。
Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時,慕尼黑工業(yè)大學(xué)計算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項目的一部分。
在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá) 20% ,且不會損失模擬的準(zhǔn)確性。
不斷擴(kuò)展的網(wǎng)絡(luò)
本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。
NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計算機(jī)。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。
與此同時,Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載。”
-
處理器
+關(guān)注
關(guān)注
68文章
19407瀏覽量
231175 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5076瀏覽量
103717 -
軟件
+關(guān)注
關(guān)注
69文章
5009瀏覽量
88066 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137786
發(fā)布評論請先 登錄
相關(guān)推薦
評論