那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LANL與NVIDIA合作打造出云原生超級計算平臺

科技綠洲 ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-06-01 14:33 ? 次閱讀

在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強大功能為超級計算機(jī)提供強大助力。

美國洛斯阿拉莫斯國家實驗室(LANL)正在與 NVIDIA 進(jìn)行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高 30 倍。

LANL 研究人員預(yù)計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。

面向 DPU 的開放式 API

這些努力還將有助于進(jìn)一步定義 OpenSNAPI ,任何人都可通過該應(yīng)用接口來控制 DPU 。這是統(tǒng)計計算框架(Unified Communication Framework)的一個項目,Unified Communication Framework 是一個旨在實現(xiàn) HPC 應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實驗室和美國的一些大學(xué)。

LANL 已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。

加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。

一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率。”

德克薩斯州打造出云原生超級計算平臺

德克薩斯高級計算中心(TACC)近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2 。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計算的開發(fā)平臺。

TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI 獲得加速

在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。

他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了 P3DFFT ,這是一個用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。

俄亥俄州立大學(xué)計算機(jī)科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團(tuán)隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負(fù)載。”

HPC 中心和云中的 DPU

對于運行藥物研發(fā)或飛機(jī)設(shè)計等 HPC 仿真應(yīng)用的超級計算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個 HPC 中心的代碼請求。

Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。

他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而 InfiniBand 已經(jīng)在為它提供支持。”

達(dá)勒姆開發(fā)負(fù)載均衡

歐洲的多個研究團(tuán)隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。

例如,英格蘭北部的達(dá)勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個節(jié)點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現(xiàn) MPI 作業(yè)的負(fù)載均衡。該項目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU 。

倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。

Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。

與此同時,慕尼黑工業(yè)大學(xué)計算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項目的一部分。

在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá) 20% ,且不會損失模擬的準(zhǔn)確性。

不斷擴(kuò)展的網(wǎng)絡(luò)

本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。

NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計算機(jī)。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。

與此同時,Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。

他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載。”

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19407

    瀏覽量

    231175
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103717
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5009

    瀏覽量

    88066
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8908

    瀏覽量

    137786
收藏 人收藏

    評論

    相關(guān)推薦

    利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

    DPU 的強大功能,并優(yōu)化 GPU 加速計算平臺。作為一種編排框架和實施藍(lán)圖,DPF 使開發(fā)者、服務(wù)提供商和企業(yè)能夠無縫構(gòu)建 BlueField 加速的云原生軟件平臺
    的頭像 發(fā)表于 01-24 09:29 ?211次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)DPU加速云<b class='flag-5'>計算</b>的未來

    云原生AI服務(wù)怎么樣

    云原生AI服務(wù),是指采用云原生的原則和技術(shù)來構(gòu)建、部署和管理人工智能應(yīng)用及工作負(fù)載的方法和模式。那么,云原生AI服務(wù)怎么樣呢?下面,AI部落小編帶您了解。
    的頭像 發(fā)表于 01-23 10:47 ?111次閱讀

    聯(lián)發(fā)科與NVIDIA合作NVIDIA 個人AI超級計算機(jī)設(shè)計NVIDIA GB10超級芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計NVIDIA GB10 Grace Blackwell超級芯片,將應(yīng)用于NVIDIA 的個人AI
    的頭像 發(fā)表于 01-07 16:26 ?194次閱讀

    云原生LLMOps平臺作用

    云原生LLMOps平臺是一種基于云計算基礎(chǔ)設(shè)施和開發(fā)工具,專門用于構(gòu)建、部署和管理大型語言模型(LLM)全生命周期的平臺。以下,是對云原生L
    的頭像 發(fā)表于 01-06 10:21 ?110次閱讀

    如何選擇云原生機(jī)器學(xué)習(xí)平臺

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺因其彈性擴(kuò)展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器學(xué)習(xí)平臺種類繁多,功能各異,如何選擇
    的頭像 發(fā)表于 12-25 11:54 ?162次閱讀

    艾體寶與Kubernetes原生數(shù)據(jù)平臺AppsCode達(dá)成合作

    虹科姐妹公司艾體寶宣布與Kubernetes 原生數(shù)據(jù)平臺 AppsCode達(dá)成正式合作,致力于將其核心產(chǎn)品KubeDB引入中國市場,為企業(yè)提供專業(yè)、高效的云原生數(shù)據(jù)庫管理解決方案。
    的頭像 發(fā)表于 12-16 15:07 ?309次閱讀

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺流程

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺是一個復(fù)雜而系統(tǒng)的過程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評估、部署和監(jiān)控等多個環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?176次閱讀

    什么是云原生MLOps平臺

    云原生MLOps平臺,是指利用云計算的基礎(chǔ)設(shè)施和開發(fā)工具,來構(gòu)建、部署和管理機(jī)器學(xué)習(xí)模型的全生命周期的平臺。以下,是對云原生MLOps
    的頭像 發(fā)表于 12-12 13:13 ?162次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

    NVIDIA 技術(shù)團(tuán)隊保持合作。賴耶科技通過NVIDIA AI Enterprise平臺打造超級
    的頭像 發(fā)表于 11-19 14:55 ?488次閱讀

    云原生和非云原生哪個好?六大區(qū)別詳細(xì)對比

    云原生和非云原生各有優(yōu)劣,具體選擇取決于應(yīng)用場景。云原生利用云計算的優(yōu)勢,通過微服務(wù)、容器化和自動化運維等技術(shù),提高了應(yīng)用的可擴(kuò)展性、更新速度和成本效益。非
    的頭像 發(fā)表于 09-13 09:53 ?464次閱讀

    京東云原生安全產(chǎn)品重磅發(fā)布

    “安全產(chǎn)品那么多,我怎么知道防住了?”“大家都說自己是云原生的,我看都是換湯不換藥”在與客戶溝通云原生安全方案的時候,經(jīng)常會遇到這樣的吐槽。越來越的客戶已經(jīng)開始了云原生化的技術(shù)架構(gòu)改造,也意識到
    的頭像 發(fā)表于 07-26 10:36 ?536次閱讀
    京東<b class='flag-5'>云原生</b>安全產(chǎn)品重磅發(fā)布

    從積木式到裝配式云原生安全

    云原生安全風(fēng)險 隨著云原生架構(gòu)的快速發(fā)展,核心能力逐漸穩(wěn)定,安全問題日趨緊急。在云原生安全領(lǐng)域不但有新技術(shù)帶來的新風(fēng)險,傳統(tǒng)IT基礎(chǔ)設(shè)施下的安全威脅也依然存在。要想做好云原生安全,就要
    的頭像 發(fā)表于 07-26 10:35 ?348次閱讀
    從積木式到裝配式<b class='flag-5'>云原生</b>安全

    基于DPU與SmartNic的云原生SDN解決方案

    隨著云計算,大數(shù)據(jù)和人工智能等技術(shù)的蓬勃發(fā)展,數(shù)據(jù)中心面臨著前所未有的數(shù)據(jù)洪流和計算壓力,這對SDN提出了更高的性能和效率要求。自云原生概念被提出以來,Kubernetes為云原生應(yīng)用
    的頭像 發(fā)表于 07-22 11:44 ?788次閱讀
    基于DPU與SmartNic的<b class='flag-5'>云原生</b>SDN解決方案

    首批認(rèn)證!拓維信息梧桐云原生平臺獲鯤鵬原生開發(fā)技術(shù)認(rèn)證

    7月10日,拓維信息梧桐云原生平臺V3.0獲得華為鯤鵬原生開發(fā)技術(shù)首批認(rèn)證。作為華為鯤鵬戰(zhàn)略合作伙伴,拓維信息以28年行業(yè)數(shù)字化經(jīng)驗和持續(xù)技術(shù)創(chuàng)新能力,攜手華為共同繁榮鯤鵬原生應(yīng)用生態(tài)
    的頭像 發(fā)表于 07-19 08:15 ?491次閱讀
    首批認(rèn)證!拓維信息梧桐<b class='flag-5'>云原生平臺</b>獲鯤鵬<b class='flag-5'>原生</b>開發(fā)技術(shù)認(rèn)證

    云原生是大模型“降本增效”的解藥嗎?

    云原生AI正當(dāng)時
    的頭像 發(fā)表于 02-20 09:31 ?435次閱讀
    百家乐官网在线小游戏| 百家乐官网庄闲| 临汾玩百家乐官网的人在那里找| 迪威百家乐官网娱乐场| 百家乐官网孖宝揽| 澳门百家乐娱乐城网址| 百家乐桌子黑色| 优博| 百家乐官网赌博机怎么玩| 模拟百家乐官网的玩法技巧和规则| 百家乐梅花图标| 赌百家乐的计划跟策略| 88娱乐城网址tlyd| 百家乐官网娱乐皇冠世界杯| 24山方向上| 百家乐平注资讯| 大方县| 百家乐官网无损打法| 百家乐视频百家乐| 大发888xp缺少 casino| TT百家乐官网现金网| 百家乐官网玩法官网| 黄金城百家乐安卓版| 巧家县| 真人百家乐官网出售| 百家乐电投网站| 有钱人百家乐官网的玩法技巧和规则| 圣保罗百家乐的玩法技巧和规则| 银河国际| 上市百家乐官网.评论| 粤港澳百家乐娱乐平台| 澳门新葡京赌场| 回力百家乐官网的玩法技巧和规则 | 大发888真钱电玩游戏| 百家乐官网相对策略| 百家乐辅助工具| 大发888在线娱乐城| 网络百家乐官网破解器| 百家乐国际娱乐场| 邻水| 百家乐官网详解|