葡京娱乐城网上百家乐,怡兰轩时时彩平台,嘉年华娱乐场官网首选金杯(中国)·官方网站

多實(shí)例 GPU （ MIG ）是 NVIDIA H100 ， A100 和 A30 張量核 GPU ，因?yàn)樗梢詫?GPU 劃分為多個(gè)實(shí)例。每個(gè)實(shí)例都有自己的計(jì)算核心、高帶寬內(nèi)存、二級(jí)緩存、 DRAM 帶寬和解碼器等媒體引擎。

這使得多個(gè)工作負(fù)載或多個(gè)用戶能夠在一個(gè) GPU 上同時(shí)運(yùn)行工作負(fù)載，以最大化 CPU 利用率，同時(shí)保證服務(wù)質(zhì)量（ QoS ）。單個(gè) A30 可以被劃分為最多四個(gè) MIG 實(shí)例，以并行運(yùn)行四個(gè)應(yīng)用程序。

這篇文章將指導(dǎo)您如何在 A30 上使用 MIG ，從劃分 MIG 實(shí)例到同時(shí)在 MIG 實(shí)例上運(yùn)行深度學(xué)習(xí)應(yīng)用程序。

A30 MIG 剖面圖

默認(rèn)情況下， A30 上禁用 MIG 模式。在分區(qū) GPU 上運(yùn)行任何 MIG 工作負(fù)載之前，必須啟用 CUDA 模式，然后對(duì) A30 進(jìn)行分區(qū)。要?jiǎng)澐?A30 ，請(qǐng)創(chuàng)建 GPU 實(shí)例，然后創(chuàng)建相應(yīng)的計(jì)算實(shí)例。

GPU 實(shí)例是 GPU 切片和 CPU 引擎（ DMA 、 NVDEC 等）的組合。 GPU 切片是 GPU 的最小部分，它組合了單個(gè) CPU 內(nèi)存切片和單個(gè)流式多處理器（ SM ）切片。

在 GPU 實(shí)例中，GPU 內(nèi)存片和其他 CPU 引擎共享，但 SM 片可以進(jìn)一步細(xì)分為計(jì)算實(shí)例。 GPU 實(shí)例提供內(nèi)存 QoS 。

您可以將具有 24 GB 內(nèi)存的 A30 配置為：

一個(gè) GPU 實(shí)例，具有 24 GB 內(nèi)存

兩個(gè) GPU 實(shí)例，每個(gè)實(shí)例具有 12 GB 內(nèi)存

三個(gè) GPU 實(shí)例，一個(gè)具有 12GB 內(nèi)存，兩個(gè)具有 6GB 內(nèi)存

四個(gè) GPU 實(shí)例，每個(gè)實(shí)例具有 6 GB 內(nèi)存

根據(jù) GPU 實(shí)例的大小，可以將 GPU 實(shí)例進(jìn)一步劃分為一個(gè)或多個(gè)計(jì)算實(shí)例。計(jì)算實(shí)例包含父 GPU 實(shí)例的 SM 切片的子集。 GPU 實(shí)例中的計(jì)算實(shí)例共享內(nèi)存和其他媒體引擎。但是，每個(gè)計(jì)算實(shí)例都有專用的 SM 切片。

例如，您可以將 A30 分成四個(gè) GPU 實(shí)例，每個(gè)實(shí)例有一個(gè)計(jì)算實(shí)例，或者將 A30 分為兩個(gè) GPU 示例，每個(gè)實(shí)例都有兩個(gè)計(jì)算實(shí)例。雖然這兩個(gè)分區(qū)導(dǎo)致四個(gè)計(jì)算實(shí)例可以同時(shí)運(yùn)行四個(gè)應(yīng)用程序，但不同之處在于，內(nèi)存和其他引擎在 GPU 實(shí)例級(jí)別隔離，而不是在計(jì)算實(shí)例級(jí)別隔離。因此，如果有多個(gè)用戶共享 A30 ，最好為不同的用戶創(chuàng)建不同的 GPU 實(shí)例以保證 QoS 。

表 1 概述了 A30 上支持的 GPU 配置文件，包括顯示 MIG 實(shí)例數(shù)量和每個(gè) CPU 實(shí)例中 GPU 切片數(shù)量的五種可能 MIG 配置。它還顯示了硬件解碼器如何在 GPU 實(shí)例之間劃分。

表 1.A30 支持的 MIG 配置文件

GPC （圖形處理集群）或切片表示 SMs 、緩存和內(nèi)存的分組。 GPC 直接映射到 GPU 實(shí)例。 OFA （光流加速器）是基于 A100 和 A30 的 GA100 架構(gòu)上的引擎。對(duì)等（ P2P ）已禁用。

表 2 提供了 A30 上受支持的 MIG 實(shí)例的配置文件名，以及內(nèi)存、 SMs 和二級(jí)緩存如何在 MIG 配置文件之間劃分。 MIG 的配置文件名可以解釋為其 GPU 實(shí)例的 SM 切片計(jì)數(shù)及其總內(nèi)存大小（ GB ）。例如：

MIG 2g 。 12gb 意味著這個(gè) MIG 實(shí)例有兩個(gè) SM 片和 12gb 內(nèi)存

MIG 4g 。 24gb 意味著這個(gè) MIG 實(shí)例有四個(gè) SM 片和 24gb 內(nèi)存

通過查看 2g 中 2 或 4 的 SM 切片計(jì)數(shù)。 12gb 或 4g 。 24gb ，您知道可以將 GPU 實(shí)例劃分為兩個(gè)或四個(gè)計(jì)算實(shí)例。

MIG 1g 。 6gb + me ： me 是指在創(chuàng)建 1g 時(shí)訪問視頻和 JPEG 解碼器的媒體擴(kuò)展。 6gb 配置文件。

MIG 實(shí)例可以動(dòng)態(tài)創(chuàng)建和銷毀?。創(chuàng)建和銷毀不會(huì)影響其他實(shí)例，因此它為您提供了銷毀未使用的實(shí)例并創(chuàng)建不同配置的靈活性。

管理 MIG 實(shí)例

使用mig-parted分區(qū)編輯器（ MIG ）自動(dòng)創(chuàng)建 GPU 實(shí)例和計(jì)算實(shí)例工具或者按照中的nvidia-smi mig命令執(zhí)行開始使用 MIG 。

強(qiáng)烈建議使用mig-parted工具，因?yàn)樗鼓軌蜉p松更改和應(yīng)用 MIG 分區(qū)的配置，而無需發(fā)出一系列nvidia-smi mig命令。在使用該工具之前，您必須按照說明安裝 mig-parted 工具或從標(biāo)記的版本中獲取預(yù)構(gòu)建的二進(jìn)制文件。

下面是如何使用該工具將 A30 劃分為 1g 的四個(gè) MIG 實(shí)例。 6gb 配置文件。首先，創(chuàng)建一個(gè)示例配置文件，然后可以與該工具一起使用。這個(gè)示例文件不僅包括前面討論的分區(qū)，還包括一個(gè)自定義配置custom-config，將 GPU 0 劃分為四個(gè) 1g 。 6gb 實(shí)例和 GPU 1 到兩個(gè) 2g 。 12gb 實(shí)例。

$ cat << EOF > a30-example-configs.yaml
version: v1
mig-configs:
  all-disabled:
    - devices: all
      mig-enabled: false

  all-enabled:
    - devices: all
      mig-enabled: true
      mig-devices: {}

  all-1g.6gb:
    - devices: all
      mig-enabled: true
      mig-devices:
        "1g.6gb": 4

  all-2g.12gb:
    - devices: all
      mig-enabled: true
      mig-devices:
        "2g.12gb": 2

  all-balanced:
    - devices: all
      mig-enabled: true
      mig-devices:
        "1g.6gb": 2
        "2g.12gb": 1

  custom-config:
    - devices: [0]
      mig-enabled: true
      mig-devices:
        "1g.6gb": 4
    - devices: [1]
      mig-enabled: true
      mig-devices:
        "2g.12gb": 2
EOF

接下來，應(yīng)用all-1g.6gb配置將 A30 劃分為四個(gè) MIG 實(shí)例。如果 MIG 模式尚未啟用，則mig-parted啟用GPU 模式，然后創(chuàng)建分區(qū)：

通過指定 MIG 幾何圖形，然后使用mig-parted適當(dāng)配置 GPU ，您可以輕松選擇其他配置或創(chuàng)建自己的自定義配置。

創(chuàng)建 MIG 實(shí)例后，現(xiàn)在您可以運(yùn)行一些工作負(fù)載了！

深度學(xué)習(xí)用例

您可以在 MIG 實(shí)例上同時(shí)運(yùn)行多個(gè)深度學(xué)習(xí)應(yīng)用程序。圖 1 顯示了四個(gè) MIG 實(shí)例（四個(gè) GPU 實(shí)例，每個(gè)實(shí)例都有一個(gè)計(jì)算實(shí)例），每個(gè)實(shí)例運(yùn)行一個(gè)深度學(xué)習(xí)推理模型，以最大限度地利用單個(gè) A30 同時(shí)執(zhí)行四個(gè)不同的任務(wù)。

例如，您可以 ResNet50 （圖像分類）在實(shí)例 1 上， EfficientDet （對(duì)象檢測(cè)）在實(shí)例二上， BERT （語言模型）在實(shí)例三上，以及 FastPitch （語音合成）實(shí)例四。該示例還可以表示四個(gè)不同的用戶在確保 QoS 的情況下同時(shí)共享 A30 。

性能分析

為了分析在啟用和不啟用 MIG 的情況下 A30 的性能改進(jìn)，我們對(duì) BERT PyTorch 模型 SQuAD （問答）在 A30 （帶和不帶 MIG ）和 T4 上的三種不同場(chǎng)景中。

A30 四個(gè) MIG 實(shí)例，每個(gè)實(shí)例有一個(gè)模型，總共四個(gè)模型同時(shí)微調(diào)

A30 MIG 模式被禁用，四個(gè)模型在四個(gè)容器中同時(shí)微調(diào)

A30 MIG 模式被禁用，四種型號(hào)串聯(lián)微調(diào)

T4 有四個(gè)串聯(lián)微調(diào)模型

要運(yùn)行此示例，請(qǐng)使用 NVIDIA /深度學(xué)習(xí)示例 github 回購。

根據(jù)表 3 中的實(shí)驗(yàn)結(jié)果，具有四個(gè) MIG 實(shí)例的 A30 顯示了總共四個(gè)模型的最高吞吐量和最短微調(diào)時(shí)間。

使用 MIG 的 A30 總微調(diào)時(shí)間的加速：

1.39 倍，與 A30 相比，四種型號(hào)同時(shí)使用 MIG

1.27 倍，與 A30 相比，在四個(gè)串聯(lián)型號(hào)上無 MIG

3.18 倍于 T4

A30 米格的吞吐量

1.39 倍，與 A30 相比，四種型號(hào)同時(shí)使用 MIG

1.27 倍，與 A30 相比，在四個(gè)串聯(lián)型號(hào)上無 MIG

3.18 倍于 T4

在沒有 MIG 的情況下，同時(shí)對(duì)具有四個(gè)模型的 A30 進(jìn)行微調(diào)也可以實(shí)現(xiàn)高 GPU 利用率，但不同之處在于，沒有 MIG 提供的硬件隔離。與使用 MIG 相比，它會(huì)產(chǎn)生上下文切換的開銷，并導(dǎo)致性能降低。

下一步是什么？

A30 MIG 模式基于最新的 NVIDIA Ampere 架構(gòu)，可加速各種工作負(fù)載，如大規(guī)模人工智能推理，使您能夠充分利用單個(gè) GPU ，同時(shí)以服務(wù)質(zhì)量為多個(gè)用戶提供服務(wù)。

關(guān)于作者

Maggie Zhang 是 NVIDIA 的深度學(xué)習(xí)工程師，致力于深度學(xué)習(xí)框架和應(yīng)用程序。她在澳大利亞新南威爾士大學(xué)獲得計(jì)算機(jī)科學(xué)和工程博士學(xué)位，在那里她從事 GPU / CPU 異構(gòu)計(jì)算和編譯器優(yōu)化。

Davide Onofrio 是 NVIDIA 的高級(jí)深度學(xué)習(xí)軟件技術(shù)營銷工程師。他在 NVIDIA 專注于深度學(xué)習(xí)技術(shù)開發(fā)人員關(guān)注內(nèi)容的開發(fā)和演示。戴維德在生物特征識(shí)別、虛擬現(xiàn)實(shí)和汽車行業(yè)擔(dān)任計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)工程師已有多年經(jīng)驗(yàn)。他的教育背景包括米蘭理工學(xué)院的信號(hào)處理博士學(xué)位。Ivan Belyavtsev 是一名圖形開發(fā)工程師，主要致力于開發(fā)人員支持和優(yōu)化基于虛擬引擎的游戲。他還是 Innopolis 大學(xué)游戲開發(fā)領(lǐng)域的計(jì)算機(jī)圖形學(xué)導(dǎo)師。

Pramod Ramarao 是 NVIDIA 加速計(jì)算的產(chǎn)品經(jīng)理。他領(lǐng)導(dǎo) CUDA 平臺(tái)和數(shù)據(jù)中心軟件的產(chǎn)品管理，包括容器技術(shù)。

Joe DeLaere 是負(fù)責(zé)數(shù)據(jù)中心加速計(jì)算的高級(jí)產(chǎn)品營銷經(jīng)理，專注于 GPU 和 AI 用例。此前，他曾在 Altera / Intel 和 Xilinx / AMD 擔(dān)任產(chǎn)品管理和營銷職務(wù)，專注于基于 FPGA 的數(shù)據(jù)中心加速解決方案。喬擁有圣何塞州立大學(xué)電氣工程學(xué)士學(xué)位。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5076

瀏覽量
103720
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4774

瀏覽量
129353
CUDA

CUDA

+關(guān)注

關(guān)注
0

文章
121

瀏覽量
13686

評(píng)論

相關(guān)推薦

NVIDIA火熱招聘GPU高性能計(jì)算架構(gòu)師

這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計(jì)算架構(gòu)師(功能驗(yàn)證)的崗位，有意向的朋友歡迎發(fā)送簡歷到 allelin@nvidia

發(fā)表于 09-01 17:22

NVIDIA-SMI：監(jiān)控GPU的絕佳起點(diǎn)

nvidia-smi可執(zhí)行文件位于虛擬機(jī)管理程序上。如果在同一部署中您選擇在GPU上使用作為傳遞，那么GPU正在尋找訪客上的NVIDIA驅(qū)動(dòng)程序，因此

發(fā)表于 09-04 15:18

購買哪款Nvidia GPU

。Nvidia的NV 24核，224 GB RAM，1.4 GB臨時(shí)存儲(chǔ)。這是相當(dāng)昂貴的（每月費(fèi)用超過3,400美元），除非我承諾1年或3年的承諾，略有減少。我認(rèn)為如果我購買GPU服務(wù)器，從長遠(yuǎn)來看可能會(huì)更便

發(fā)表于 09-26 15:30

意大利詩麗雅CLASSE A30開箱測(cè)評(píng)

體驗(yàn)推向一個(gè)更高層次的功放——詩麗雅CLASSE A30。筆者也在一番體驗(yàn)下，第一時(shí)間把它加入了我的改裝配置之中。下面給大家?guī)磉@臺(tái)功放的全方位開箱測(cè)評(píng)。拆開外包裝，最直觀地映入眼簾的就是他的外觀設(shè)計(jì)

發(fā)表于 09-26 12:06

NVIDIA網(wǎng)格GPU-PSOD的支持結(jié)構(gòu)

they blamed it on the nvidia gpu but they dont know if its a driver or hardware issue.Can a

發(fā)表于 10-10 16:15

Nvidia GPU風(fēng)扇和電源顯示ERR怎么解決

問題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候，如果機(jī)器鎖屏一段時(shí)間再打開的時(shí)候鼠標(biāo)非常卡頓，或者說顯示界面非常卡頓，使用nvidia-smi查看發(fā)現(xiàn)，訓(xùn)練模型的GPU

發(fā)表于 12-30 06:44

在Ubuntu上使用Nvidia GPU訓(xùn)練模型

問題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候，沒有問題，過一會(huì)再訓(xùn)練出現(xiàn)非常卡頓，使用nvidia-smi查看發(fā)現(xiàn)，顯示GPU的風(fēng)扇和電源報(bào)錯(cuò)：解決方案自動(dòng)風(fēng)扇控制在

發(fā)表于 01-03 08:24

A30 USB音頻介面使用說明書

產(chǎn)品簡介 A30是一臺(tái)方便攜帶USB音頻接口，能將任何模擬聲音訊號(hào)轉(zhuǎn)成數(shù)字檔案的聲音數(shù)碼模擬轉(zhuǎn)換器。另外，在連接計(jì)算器和無聲卡的MIDI控制器時(shí)，A30可以當(dāng)作聲卡來連接

發(fā)表于 12-29 00:35 ?22次下載

艾邁斯推出具有卓越噪聲性能的A30新型高性能模擬技術(shù)

全球領(lǐng)先的高性能傳感器和模擬IC供應(yīng)商艾邁斯半導(dǎo)體今天宣布推出高性能模擬低噪聲CMOS制程工藝（“A30”）。這種新型的A30制程工藝具有卓越的噪聲性能，并通過光刻工藝使體積縮小至艾邁斯半導(dǎo)體高級(jí)0.35μm高壓CMOS制程工藝

發(fā)表于 12-06 16:11 ?957次閱讀

臺(tái)電發(fā)布極光DDR4 A30內(nèi)存,自帶散熱裝甲

A30的主要亮點(diǎn)一是高頻，二是自主研發(fā)的散熱裝甲（御風(fēng)者）。據(jù)悉，極光A30 DDR4內(nèi)存分為4GB/8GB/16GB可選，頻率達(dá)到2400MHz，比常規(guī)普條（2133Mhz）更高。

發(fā)表于 11-09 14:07 ?1393次閱讀

NVIDIA安培大核心GPU已集合多個(gè)國內(nèi)廠商技術(shù)

NVIDIA今天在GTC大會(huì)上宣布，多家中國頂級(jí)云服務(wù)提供商、系統(tǒng)制造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA

發(fā)表于 12-16 10:21 ?3223次閱讀

最新版本CUDA 11.4功能及其特性

的 NVIDIA A30 GPU 啟用新的 MIG 配置，使每個(gè) MIG 片的內(nèi)存量增加一倍。這將為 A30 GPU 上的各種

發(fā)表于 04-02 16:59 ?3713次閱讀

使用NVIDIA A30 GPU加速AI推理工作負(fù)載

　　A30 旨在通過提供四個(gè)視頻解碼器、一個(gè) JPEG 解碼器和一個(gè)光流解碼器來加速智能視頻分析（ IVA ）。

發(fā)表于 05-16 09:25 ?3304次閱讀

恩智浦發(fā)布EdgeLock A30安全認(rèn)證器

系列，持續(xù)致力于推動(dòng)工業(yè)和智能家居能源管理系統(tǒng)的創(chuàng)新。這款EdgeLock A30安全認(rèn)證器旨在幫助制造商快速、便捷地為各種市場(chǎng)中的設(shè)備和配件提供可靠的安全認(rèn)證方案，涵蓋游戲、計(jì)算、智能家居、能源管理、工業(yè)及醫(yī)療保健等多個(gè)領(lǐng)域，并

發(fā)表于 01-23 15:43 ?120次閱讀

恩智浦推出EdgeLock A30安全認(rèn)證器

恩智浦推出符合CC (Common Criteria) EAL6+認(rèn)證的EdgeLock A30安全認(rèn)證器，兼容標(biāo)準(zhǔn)MCU和MPU，具備大容量內(nèi)存，支持EdgeLock 2GO，為安全入網(wǎng)和設(shè)備信息保護(hù)提供優(yōu)化的解決方案。

發(fā)表于 01-24 10:29 ?553次閱讀

那曲檬骨新材料有限公司

搜索歷史

分割NVIDIA A30 GPU并征服多個(gè)工作負(fù)載