那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA A100 GPU推理性能237倍碾壓CPU

工程師鄧生 ? 來源:雷鋒網 ? 作者:包永剛 ? 2020-10-23 17:40 ? 次閱讀

MLPerf組織今天發布最新的推理基準測試(Benchmark)MLPerf Inference v0.7結果,總共有23個組織提交了結果,相比上一個版本(MLPerf Inference v0.5)的12個提交者增加了近一倍。

結果顯示,今年5月NVIDIA(Nvidia)發布的安培(Ampere)架構A100 Tensor Core GPU,在云端推理的基準測試性能是最先進Intel CPU的237倍。

MLPerf Inference V0.7部分結果截圖

最新的AI推理測試結果意味著,NVIDIA未來可能在AI推理和訓練市場都占據領導地位,給云端AI推理市場擁有優勢的Intel帶來更大壓力的同時,也將讓其他追趕者面臨更大挑戰。

MLPerf推理基準測試進一步完善的價值

與2019年的MLPerf Inference v0.5版本相比,最新的0.7版本將測試從AI研究的核心視覺和語言的5項測試,擴展了到了包括推薦系統、自然語言理解、語音識別和醫療影像應用的6項測試,并且有分別針對云端和終端推理的測試,還加入了手機和筆記本電腦的結果。

擴展的測試項從MLPerf和業界兩個角度都有積極意義。

MLPerf Inference v0.5測試項

MLPerf Inference v0.7數據中心測試項

MLPerf Inference v0.7邊緣端測試項

任何一個基準測試都需要給業界具有參考價值的指標。MLPerf基準測試是在業界缺乏對AI芯片公認的評價標準的2018年誕生,因此,MLPerf組織既需要給出各方都認可的成績,還需要根據AI行業的發展完善評價標準。

不過,AI行業發展迅速,AI模型的參數越來越多,應用的場景也越來越廣泛。評價AI芯片和系統的推理性能需要涵蓋可編程性、延遲、準確性、模型大小、吞吐量、能效等指標,也需要選擇更具指導價值的模型和應用。

此次增加的推薦系統測試對于互聯網公司意義重大。在王喆的《深度學習推薦系統》一書中提到,2019年天貓“雙11”的成交額是2684億元,假設推薦系統進行了優化,整體的轉化率提高1%,那么增加的成交額大約為26.84億元。

另外,MLPerf Inference v0.7中增加醫療影像3D U-Net模型測試與新冠大流行以及AI在醫療行業的重要性與日俱增密切相關,比如一家初創公司使用AI簡化了超聲心電圖的采集工作,在新冠大流行初期發揮了作用。

基準測試從v0.5到v0.7,能夠為要選用AI芯片和系統的公司提供更直觀和有價值的參考是MLPerf基準測試的價值所在,比如,幫助金融結構的會話式AI更快速回答客戶問題,幫助零售商使用AI保證貨架庫存充足。

與此同時,這也將促進MLPerf組織在業界的受認可程度,從接近翻倍的提交成績的組織就能看出來。

GPU云端推理性能最高是CPU的237倍

過去幾年,云端AI訓練市場NVIDIA擁有絕對優勢,云端AI推理市場被Intel賺取了大部分利潤是事實。這讓不少人都產生了GPU更適合訓練而CPU更適合推理的認知,但MLPerf最新的推理測試結果可能會改變這一觀點。

MLPerf Inference V0.7的測試結果顯示,在數據中心OFFLINE(離線)測試模式下,賽靈思U250和IntelCooper Lake在各個測試模型下與NVIDIAT4的差距不大,但A100對比CPU、FPGA和自家的T4就有明顯的性能差距。

在SERVER模式下的推薦系統DLRM模型下,A100 GPU對比IntelCooper Lake有最高237倍的性能差距,在其他模型下也有比較顯著的差距。值得注意的是,Intel的Cooper Lake系統的狀態還是預覽,其余三款芯片的系統都已經可用。

A100 GPU的優勢也在邊緣推理中也十分明顯。在單數據流(Singel-Stream)測試中,A100對比NVIDIAT4和面向邊緣終端的NVIDIAJetson AGX Xavier有幾倍到十幾倍的性能優勢。在多數據流(Multi-Stream)測試中,A100對比另外兩款自家產品在不同AI模型中有幾倍到二十多倍的性能優勢。

在邊緣OFFLINE模式下,A100對比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優勢。

這很好地說明A100的安培架構以及其第三代Tensor Core優勢的同時,也表明了NVIDIA能夠覆蓋整個AI推理市場。

在此次提交結果的23家公司中,除了NVIDIA外還有11家其合作伙伴提交了基于NVIDIA GPU的1029個測試結果,占數據中心和邊緣類別中參評測試結果總數的85%以上。

從提交結果的合作伙伴的系統中可以看到,NVIDIAT4仍然是企業的邊緣服務器推理平臺的主要選擇。A100提升到新高度的性能意味著未來企業邊緣服務器在選擇AI推理平臺的時候,可以從T4升級到A100,對于功耗受限的設備,可以選擇Jeston系列產品。

特別值得注意的是,NVIDIA GPU首次在公有云中實現了超越CPU的AI推理能力。

臨界點到來?AI推理芯片市場競爭門檻更高

五年前,只有少數領先的高科技公司使用GPU進行推理。如今,NVIDIAGPU首次在公有云市場實現超越CPU的AI推理能力,或許意味著AI推理市場臨界點的到來。NVIDIA還預測,基于其GPU的總體云端AI推理計算能力每兩年增長約10倍,增長速度高于CPU。

另外,NVIDIA還強調基于A100高性能系統的成本效益。NVIDIA表示,一套DGX A100系統可以提供相當于近1000臺雙插槽CPU服務器的性能,能為客戶AI推薦系統模型從研發走向生產的過程,具有極高的成本效益。

同時,NVIDIA也在不斷優化推理軟件堆棧,進一步提升在推理市場的競爭力。

最先感受到影響的會是Intel,但在云端AI推理市場體現出顯著變化至少需要幾年時間,因為企業在更換平臺的時候會更加謹慎,生態的護城河此時也更能體現出價值。

但無論如何,我們都看到NVIDIA在AI市場的強勢地位。雷鋒網七月底報道,在MLPerf發布的MLPerf Training v0.7基準測試中,A100 Tensor Core GPU,和HDR InfiniBand實現多個DGX A100 系統互聯的龐大集群DGX SuperPOD系統在性能上開創了八個全新里程碑,共打破16項紀錄。

安培架構A100在MLPerf最新的訓練和推理成績表明NVIDIA不僅給云端AI訓練的競爭者更大的壓力,也可能改變AI推理市場的格局。

NVIDIA將其在云端訓練市場的優勢進一步拓展到云端和邊緣推理市場符合AI未來的發展趨勢。有預測指出,隨著AI模型的成熟,市場對云端AI訓練需求的增速將會降低,云端AI推理的市場規模將會迅速增加,并有望在2022年超過訓練市場。

另據市場咨詢公司ABI Research的數據,預計到2025年,邊緣AI芯片市場收入將達到122億美元,云端AI芯片市場收入將達到119億美元,邊緣AI芯片市場將超過云端AI芯片市場。

憑借強大的軟硬件生態系統,NVIDIA和Intel依舊會是AI市場的重要玩家,只是隨著他們競爭力的不斷提升,其他參與AI市場競爭的AI芯片公司們面臨的壓力也隨之增加。
責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103714
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4773

    瀏覽量

    129349
收藏 人收藏

    評論

    相關推薦

    解鎖NVIDIA TensorRT-LLM的卓越性能

    Batching、Paged KV Caching、量化技術 (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能,確保您的 NVIDIA GPU 能發揮出卓越的推理性能
    的頭像 發表于 12-17 17:47 ?278次閱讀

    CPU推理:AI算力配置新范式

    在當前的人工智能領域,尤其是涉及到深度學習的推理階段,行業普遍認為GPU是唯一的選擇。然而,GPU的成本相對較高,且對于某些特定的應用場景,其高昂的價格和較高的能耗成為了一大負擔。相比之下,C
    的頭像 發表于 11-21 01:03 ?376次閱讀
    <b class='flag-5'>CPU</b><b class='flag-5'>推理</b>:AI算力配置新范式

    AMD與NVIDIA GPU優缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產品在性能、功耗、價格等方面都有著不同的特點和優勢。 一、性能
    的頭像 發表于 10-27 11:15 ?999次閱讀

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    近期,第五代英特爾?至強?可擴展處理器通過了中國電子技術標準化研究院組織的人工智能服務器系統性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業
    的頭像 發表于 09-06 15:33 ?421次閱讀
    開箱即用,AISBench測試展示英特爾至強處理器的卓越<b class='flag-5'>推理性能</b>

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫,專門為實時在線 GPU 數據包處理而設計。它結合了 GPUDirect RDMA 和 GPUDirect
    的頭像 發表于 08-23 17:03 ?707次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO<b class='flag-5'>性能</b>測試

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,提高了大模型產業應用效率,更大規模地釋放大模型的應用價值。”
    的頭像 發表于 08-23 15:48 ?509次閱讀

    基于 ARM Cortex M0+內核BAT32A237芯片

    組合開關方案性能特點: 主芯片BAT32A237可靠性標準參考AEC-Q100 Grade 1級別 使用LN總線與主機通信,支持休眠喚醒 燈光開關輸入檢測 轉向開關輸入檢測 雨刮開關輸入檢測 洗滌開關輸入檢
    發表于 07-31 16:07

    Flow Computing引領CPU性能革命:PPU技術實現百性能提升

    在科技日新月異的今天,芬蘭的一家科技初創公司Flow Computing以其革命性的技術突破,再次讓全球科技界為之震撼。近日,該公司宣布其研發的并行處理單元(PPU)成功實現了對任何CPU架構性能高達100
    的頭像 發表于 06-14 14:34 ?1350次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    架構在高性能計算方面的應用有哪些? **1. **人工智能訓練和推理 Blackwell 架構的 GPU 核心在訓練性能上相較前代 Hopper H
    發表于 05-13 17:16

    龍芯:自主研發CPU提升性能,單核通用性能提高20

    張戈強調,龍芯CPU的主要IP核均為自主研發,這使得其性價比得到顯著提升。他指出,國產CPU與主流CPU的差距主要體現在單核性能上,而非多核性能
    的頭像 發表于 04-25 15:26 ?872次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱
    的頭像 發表于 04-20 09:39 ?821次閱讀

    自然語言處理應用LLM推理優化綜述

    當前,業界在將傳統優化技術引入 LLM 推理的同時,同時也在探索從大模型自回歸解碼特點出發,通過調整推理過程和引入新的模型結構來進一步提升推理性能
    發表于 04-10 11:48 ?683次閱讀
    自然語言處理應用LLM<b class='flag-5'>推理</b>優化綜述

    超微電腦借助英偉達Blackwell架構,打造頂尖生成式AI系統

    Grace Blackwell Superchip、B200和B100 Tensor Core GPU等尖端產品,專為優化AI訓練和推理性能而設計。
    的頭像 發表于 03-25 10:27 ?718次閱讀

    英偉達H200和A100的區別

    英偉達H200和A100兩款芯片在性能、架構、內存以及應用場景等多個方面存在顯著的區別。
    的頭像 發表于 03-07 16:23 ?3929次閱讀

    英偉達H200和A100的差異

    英偉達H200和A100在多個方面存在差異。
    的頭像 發表于 03-07 16:18 ?2801次閱讀
    北宁市| 百家乐官网天天乐娱乐场| 百家乐投注法| 大发888网络赌博害人| 澳门百家乐官网然后赢| 香港六合彩官方| 百家乐代理网址| 谈谈百家乐官网赢钱技巧| 大发888娱乐城官方网站| 我的做生意财位| 百家乐官网纯数字玩法| bet365官方网址| 江山百家乐的玩法技巧和规则 | 综合百家乐官网博彩论坛| 海立方百家乐官网赢钱| 大发888破解老虎机| 线上百家乐的玩法技巧和规则| 权威百家乐官网信誉网站| ican博彩通| 利博百家乐的玩法技巧和规则 | 百家乐官网注册送彩金平台| 嘉义县| 百家乐园首选去澳| 百家乐网络赌场| 天堂鸟百家乐官网的玩法技巧和规则 | 最好的百家乐博彩网站| 百家乐官网论坛| 可信百家乐官网的玩法技巧和规则| 网上百家乐官网平台下载| 百家乐官网有哪些注| 会同县| 百家乐官网平台开发| 大发888在线服务| A8百家乐的玩法技巧和规则| 百家乐连长| 百家乐全讯网娱乐城| 凯旋门百家乐娱乐城| 新世纪百家乐现金网| 玩百家乐怎么才能赢| 如何看百家乐的路纸| 玩百家乐五湖四海娱乐城|