那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為何要使用NVIDIA HPC SDK

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-10-09 10:22 ? 次閱讀

NVIDIA HPC SDK包含經(jīng)過驗(yàn)證的編譯器、庫和軟件工具,對于更大程度提高開發(fā)者的工作效率以及 HPC 應(yīng)用的性能和可移植性至關(guān)重要。

NVIDIA HPC SDK C、C++ 和 Fortran 編譯器支持使用標(biāo)準(zhǔn) C++ 和 Fortran、OpenACC 指令和 CUDA 實(shí)現(xiàn) HPC 建模和模擬應(yīng)用的 GPU 加速。GPU 加速的數(shù)學(xué)庫可更大限度地提升常用 HPC 算法的性能,而經(jīng)過優(yōu)化的通信庫支持基于標(biāo)準(zhǔn)的多 GPU 和可擴(kuò)展的系統(tǒng)編程。性能分析和調(diào)試工具可簡化 HPC 應(yīng)用的移植和優(yōu)化流程,而容器化工具支持在本地或云端輕松部署。HPC SDK 支持 NVIDIA GPU 和 Arm、OpenPOWER 或運(yùn)行 Linux 的 x86-64 CPU,為您提供構(gòu)建 NVIDIA GPU 加速的 HPC 應(yīng)用所需的工具。

為何要使用 NVIDIA HPC SDK?

性能

除了應(yīng)用廣泛的 HPC 應(yīng)用(包括 VASP、Gaussian、ANSYS Fluent、GROMACS 和 NAMD),還可以使用 CUDA、OpenACC 和 GPU 加速的數(shù)學(xué)庫,為用戶提供突破性性能。您可以使用這些相同的軟件工具對應(yīng)用進(jìn)行 GPU 加速,還可以使用 NVIDIA GPU 實(shí)現(xiàn)速度和能效大幅提升。

可移植性

為 99% 以上的 500 強(qiáng)系統(tǒng)(包括基于 NVIDIA GPU 或 x86-64、Arm 或 OpenPOWER CPU 的系統(tǒng))構(gòu)建和優(yōu)化應(yīng)用。您可以使用嵌入式庫、C++17 并行算法和 OpenACC 指令對您的代碼進(jìn)行 GPU 加速,并確保應(yīng)用完全可移植到其他編譯器和系統(tǒng)。

工作效率

借助能夠讓您快速移植、并行和優(yōu)化 GPU 加速的單一集成套件(包括用于多 GPU 和可擴(kuò)展計(jì)算的行業(yè)標(biāo)準(zhǔn)通信庫,以及用于分析的分析和調(diào)試工具),可以更大限度地提高科學(xué)和工程吞吐量,更大限度地減少編碼時(shí)間。

支持您喜歡的編程語言

C++17 并行算法

C++17 并行算法使用標(biāo)準(zhǔn)模板庫(STL)實(shí)現(xiàn)可移植的并行編程。NVIDIA HPC SDK C++ 編譯器在 CPU 上支持完整的 C++17,可將并行算法分流至 NVIDIA GPU,支持無指令、雜注或標(biāo)注的 GPU 編程。使用 C++17 并行算法的程序很容易移植到常用 C++ 的 Linux、Windows 和 macOS。

Fortran 2003 編譯器

NVIDIA Fortran 編譯器支持 Fortran 2003,以及 Fortran 2008 的許多功能。它支持在 GPU 上的 OpenACC 和 CUDA Fortran,也支持在 x86-64、Arm 和 OpenPOWER 這些多核 CPU 上的 SIMD 向量化、OpenACC 和 OpenMP。這樣,他就具有在當(dāng)今由 GPU 加速的異構(gòu) HPC 系統(tǒng)上移植和優(yōu)化 Fortran 應(yīng)用所需的功能。

OpenACC 指令

NVIDIA Fortran、C 和 C++ 編譯器支持基于 OpenACC 指令的并行編程,適用于 NVIDIA GPU 和多核 CPU。超過 200 款 HPC 應(yīng)用端口已使用 OpenACC 啟動(dòng)或啟用,包括 VASP、Gaussian、ANSYS Fluent、WRF 和 MPAS 等量產(chǎn)型應(yīng)用。OpenACC 適用于 GPU 和多核 CPU,是經(jīng)過驗(yàn)證的性能可移植指令解決方案。

主要功能

GPU 數(shù)學(xué)庫

NVIDIA HPC SDK 包括一套GPU 加速的數(shù)學(xué)庫,適用于計(jì)算密集型應(yīng)用。cuBLAS 和 cuSOLVER 庫可提供來自 LAPACK 的各種 BLAS 例程和核心例程的經(jīng) GPU 優(yōu)化的多 GPU 的實(shí)施,并盡可能自動(dòng)使用 NVIDIA GPU Tensor Core。cuFFT 包括用于真實(shí)和復(fù)雜數(shù)據(jù)的 GPU 加速的 1D、2D 和 3D FFT 例程,cuSPARSE 為稀疏矩陣提供基礎(chǔ)線性代數(shù)子例程。可以通過使用 C、C++ 和 Fortran 編寫的 CUDA 和 OpenACC 程序調(diào)用這些庫。

對 Tensor Core 進(jìn)行優(yōu)化

通過NVIDIA GPU Tensor Core,科學(xué)家和工程師能夠使用混合精度或雙精度大幅加速合適的算法。這些 NVIDIA HPC SDK 數(shù)學(xué)庫對 Tensor Core 和多 GPU 節(jié)點(diǎn)進(jìn)行了優(yōu)化,無需多費(fèi)力編碼,即可提供系統(tǒng)的全部性能潛力。利用 NVIDIA Fortran 編譯器,通過將可轉(zhuǎn)換的數(shù)組內(nèi)聯(lián)函數(shù)自動(dòng)映射至 cuTENSOR 庫,您可以使用 Tensor Core。

對您的 CPU 進(jìn)行優(yōu)化

異構(gòu) HPC 服務(wù)器使用 GPU 進(jìn)行加速計(jì)算,并基于 x86-64、OpenPOWER 或 Arm 指令集架構(gòu)使用多核 CPU。NVIDIA HPC 編譯器和工具在這些 CPU 上受支持,并且所有編譯器優(yōu)化可在支持這些編譯器的 CPU 上完全啟用。借助跨所有受支持系統(tǒng)的統(tǒng)一功能、命令行選項(xiàng)、語言實(shí)現(xiàn)、編程模型、工具和庫用戶界面,NVIDIA HPC SDK 可簡化開發(fā)者在各種 HPC 環(huán)境中的體驗(yàn)。

多 GPU 編程

NVIDIA 集合通信庫(NCCL)使用 MPI 兼容的 all-gather、all-reduce、broadcast、reduce 和 reduce-scatter 例程實(shí)現(xiàn)高度優(yōu)化的多 GPU 和多節(jié)點(diǎn)集合通信基元,以利用 HPC 服務(wù)器節(jié)點(diǎn)內(nèi)和跨 HPC 服務(wù)器節(jié)點(diǎn)的所有可用 GPU。NVSHMEM 可實(shí)現(xiàn) GPU 顯存的 OpenSHMEM 標(biāo)準(zhǔn),并提供多 GPU 和多節(jié)點(diǎn)通信基元,這些基元可通過主機(jī) CPU 或 GPU 啟動(dòng),也可在 CUDA 內(nèi)核中調(diào)用。

可擴(kuò)展系統(tǒng)編程

MPI是編程分布式內(nèi)存可擴(kuò)展系統(tǒng)的標(biāo)準(zhǔn)。NVIDIA HPC SDK 包括基于 Open MPI 的 CUDA-aware MPI 庫,支持 GPUDirect,這樣您可以直接使用遠(yuǎn)程直接數(shù)據(jù)存取(RDMA)來發(fā)送和接收 GPU 緩沖區(qū),包括在 CUDA 統(tǒng)一內(nèi)存中分配的緩沖區(qū)。CUDA-aware Open MPI 完全兼容 CUDA C / C++、CUDA Fortran 和 NVIDIA OpenACC 編譯器。

Nsight 性能分析

Nsight 系統(tǒng)可在系統(tǒng)范圍內(nèi)可視化 HPC 服務(wù)器上的應(yīng)用性能,并使您能夠在多核 CPU 和 GPU 中優(yōu)化瓶頸并擴(kuò)展并行應(yīng)用。Nsight Compute 允許您通過圖形或命令行用戶界面,在交互式分析器中深入探討 GPU 內(nèi)核,以用于 GPU 加速的應(yīng)用,并允許您使用 NVTX API 直接檢測源代碼的區(qū)域,從而確定性能瓶頸。

隨時(shí)隨地部署

容器將應(yīng)用及其依賴項(xiàng)捆綁到便攜式虛擬環(huán)境中,從而簡化軟件部署。NVIDIA HPC SDK 包含使用 HPC Container Maker 開發(fā)、分析和部署軟件簡化容器鏡像創(chuàng)建流程的說明。NVIDIA Container Runtime可在幾乎所有容器框架(包括 Docker 和 Singularity)中實(shí)現(xiàn)無縫 GPU 支持。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103726
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4776

    瀏覽量

    129358
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1045

    瀏覽量

    46273

原文標(biāo)題:DevZone | NVIDIA HPC SDK

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    HPC云計(jì)算的技術(shù)架構(gòu)

    HPC云計(jì)算結(jié)合了HPC的強(qiáng)大計(jì)算能力和云計(jì)算的彈性、可擴(kuò)展性,為用戶提供了按需獲取高性能計(jì)算資源的便利。下面,AI部落小編帶您了解HPC云計(jì)算的技術(shù)架構(gòu)。
    的頭像 發(fā)表于 02-05 14:51 ?51次閱讀

    HPC按需計(jì)費(fèi)模式的優(yōu)勢

    當(dāng)下,HPC按需計(jì)費(fèi)模式不僅降低了用戶的經(jīng)濟(jì)負(fù)擔(dān),提高了資源利用效率,還推動(dòng)了科技創(chuàng)新的普及和發(fā)展。以下,是對HPC按需計(jì)費(fèi)模式優(yōu)勢的梳理,由AI部落小編整理。
    的頭像 發(fā)表于 01-24 09:55 ?98次閱讀

    云計(jì)算和HPC的關(guān)系

    盡管云計(jì)算和HPC在架構(gòu)、應(yīng)用場景和成本效益等方面存在顯著差異,但云計(jì)算和HPC之間并非孤立存在,而是相互補(bǔ)充、協(xié)同發(fā)展的關(guān)系。下面,AI部落小編帶您探討云計(jì)算和HPC的關(guān)系。
    的頭像 發(fā)表于 12-14 10:35 ?173次閱讀

    云計(jì)算hpc的主要功能是什么

    云計(jì)算HPC(High-Performance Computing)是指利用云計(jì)算技術(shù)來實(shí)現(xiàn)高性能計(jì)算的一種解決方案。云計(jì)算HPC將高性能計(jì)算能力以云服務(wù)的形式提供給用戶。
    的頭像 發(fā)表于 10-22 10:20 ?250次閱讀

    HPC云計(jì)算前景

    高性能計(jì)算(HPC)與云計(jì)算的結(jié)合,正逐步成為推動(dòng)科技創(chuàng)新和產(chǎn)業(yè)升級(jí)的重要引擎。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大和計(jì)算需求的日益復(fù)雜,HPC云計(jì)算展現(xiàn)出了巨大的潛力和價(jià)值。
    的頭像 發(fā)表于 10-16 10:17 ?276次閱讀

    NVIDIA JetPack 6.0版本的關(guān)鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應(yīng)用提供全面的解決方案。JetPack 6 通過微服務(wù)和一系列新功能,擴(kuò)展了 Jetson 平臺(tái)的靈活性和可擴(kuò)展性,是 202
    的頭像 發(fā)表于 09-09 10:18 ?528次閱讀
    <b class='flag-5'>NVIDIA</b> JetPack 6.0版本的關(guān)鍵功能

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個(gè)庫,專門為實(shí)時(shí)在線 GPU 數(shù)據(jù)包處理而設(shè)計(jì)。它結(jié)合了 GPUDirect RDMA 和 GPUDirect
    的頭像 發(fā)表于 08-23 17:03 ?712次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測試

    SDK通過UART端口發(fā)送消息,有沒有辦法關(guān)閉SDK中的消息?

    我正在設(shè)計(jì)一些需要使用 UART 端口的應(yīng)用程序。使用 SDK 1.1.0 時(shí),我發(fā)現(xiàn) SDK 在系統(tǒng)運(yùn)行時(shí)會(huì)輸出一些消息。有沒有辦法關(guān)閉 SDK 中的消息?謝謝。
    發(fā)表于 07-12 10:01

    NVIDIA突破美國禁令,將在中東部署其高性能AI/HPC GPU加速卡

    Ooredoo達(dá)成合作協(xié)議,將在中東地區(qū)部署其高性能AI/HPC GPU加速卡。這一舉動(dòng)不僅標(biāo)志著NVIDIA在中東市場的戰(zhàn)略布局取得了重大突破,也引發(fā)了外界對于如何防止這些先進(jìn)技術(shù)流向中國的廣泛討論。
    的頭像 發(fā)表于 06-24 14:47 ?911次閱讀

    MediaTek NeuroPilot SDK整合NVIDIATAO

    MediaTek 在 COMPUTEX 2024 期間宣布將 NVIDIA TAO 與 MediaTek NeuroPilot SDK 集成,應(yīng)用于邊緣 AI 推理芯片的開發(fā)。MediaTek
    的頭像 發(fā)表于 06-12 14:03 ?529次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺AI開發(fā)

    NVIDIA DeepStream 是一款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺 AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?774次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布DeepStream 7.0,助力下一代視覺AI開發(fā)

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決?

    我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,請參閱 Nvidia Jetson 與英飛凌 AIROC Wi-Fi 6
    發(fā)表于 05-23 06:47

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報(bào)、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?464次閱讀
    助力科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> AI加速<b class='flag-5'>HPC</b>研究

    利用NVIDIA AI Enterprise IGX在邊緣賦能任務(wù)關(guān)鍵型AI

    NVIDIA SDK 在加速智慧城市、醫(yī)療和機(jī)器人等領(lǐng)域的 AI 應(yīng)用方面發(fā)揮了重要作用。
    的頭像 發(fā)表于 04-26 09:46 ?553次閱讀
    利用<b class='flag-5'>NVIDIA</b> AI Enterprise IGX在邊緣賦能任務(wù)關(guān)鍵型AI

    什么是HPC高性能計(jì)算

    高性能計(jì)算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計(jì)算機(jī)技術(shù),通過合理地組織計(jì)算機(jī)資源以及運(yùn)用適合的算法和程序,提高計(jì)算效率和處理能力,實(shí)現(xiàn)對大量
    的頭像 發(fā)表于 02-19 13:27 ?941次閱讀
    什么是<b class='flag-5'>HPC</b>高性能計(jì)算
    娱乐城注册送18元| 百家乐鸿泰棋牌| 旅游赌博景点lydb| 百家乐平台注册送彩金| 网上百家乐官网投注法| 百家乐必胜法技巧| 百家乐官网赌场破解方法| 大发888国际游戏平台| 百家乐官网真人博彩的玩法技巧和规则 | 百家乐官网透视牌靴哪里有| 大发888游戏平台dafa888 gw| 百家乐网娱乐城| 百家乐官网视频双扣游戏| 大发888娱乐城出纳| 百家乐能作弊吗| 百乐门娱乐城注册| 百家乐赌博大揭密| 线上百家乐官网| 鸿胜博娱乐| 百家乐官网六手变化混合赢家打| 大发888斗地主| 网上百家乐如何打水| 网上百家乐官网信誉| 棋牌室经营| 九宫飞星2024年的财位| 昌黎县| 老虎机下载| 菲律百家乐太阳城| 百家乐官网正负计| 临朐县| 大发888娱乐场118| 百家乐官网赢的技巧| 大发888官方体育| 南京百家乐赌博现场被抓| 百家乐官网号技巧| 百家乐官网乐城皇冠| 现金网开户| 百家乐五湖四海娱乐场开户注册| 百家乐官网玩法介| 真人百家乐官网新开户送彩金| 卡迪拉娱乐城开户|