那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么?不用GPU也能加速你的YOLOv3深度學習模型

新機器視覺 ? 來源:量子位 ? 作者:量子位 ? 2021-06-10 15:33 ? 次閱讀

你還在為神經網絡模型里的冗余信息煩惱嗎?

或者手上只有CPU,對一些只能用昂貴的GPU建立的深度學習模型“望眼欲穿”嗎?

最近,創業公司Neural Magic帶來了一種名叫新的稀疏化方法,可以幫你解決煩惱,讓你的深度學習模型效率“一節更比七節強”!

Neural Magic是專門研究深度學習的稀疏方法的公司,這次他們發布了教程:用recipe稀疏化YOLOv3。

聽起來有點意思啊,讓我們來看看是怎么實現的~

稀疏化的YOLOv3

稀疏化的YOLOv3使用剪枝(prune)和量化(quantize)等算法,可以刪除神經網絡中的冗余信息。

這種稀疏化方法的好處可不少。

它的推斷速度更快,文件更小。

但是因為過程太復雜,涉及的超參數又太多,很多人都不太關心這種方法。

Neural Magic的ML團隊針對必要的超參數和指令,創建了可以自主編碼的recipe。

各種不同條件下的recipe構成了一種可以滿足客戶各類需求的框架。

這樣就可以建立高度精確的pruned或pruned quantized的YOLOv3模型,從而簡化流程。

那這種稀疏化方法的靈感來源是什么呢?

其實,Neural Magic 的 Deep Sparse(深度稀疏)架構的主要靈感,是在產品硬件上模仿大腦的計算方式。

它通過利用 CPU 的大型快速緩存和大型內存,將神經網絡稀疏性與通信局部性相結合,實現效率提升。

教程概況

本教程目錄主要包括三大模塊:

創建一個預訓練的模型

應用Recipe

導出推理教程的這些recipe可以幫助用戶在Ultralytics強大的訓練平臺上,使用稀疏深度學習的recipe驅動的方法插入數據。

教程中列出的示例均在VOC數據集上執行,所有結果也可通過“權重和偏差”項目公開獲得(地址見參考鏈接4)。

調試結果展示

研究團隊給出了稀疏YOLOv3目標檢測模型在Deep Sparse引擎和PyTorch上的運行情況。

這段視頻以波士頓著名地標為特色,在Neural Magic的誕生地——MIT的校園取景。

同樣的條件下,在Deep Sparse引擎上比PyTorch上效率會更高。

遇到的常見問題

如果用戶的硬件不支持量化網絡來推理加速,或者對完全恢復的要求非常高,官方建議使用pruned或pruned short 的recipe。

如果用戶的硬件可以支持量化網絡,如CPU 上的 VNNI 指令集,官方建議使用pruned quantized或pruned quantized short的recipe。

所以使用哪一種recipe,取決于用戶愿意花多長時間訓練數據,以及對完全恢復的要求。

具體要比較這幾種recipe的話,可以參考下表。

ce8f673a-c9b7-11eb-9e57-12bb97331649.png

網友:這個框架會比傳統的機器學習框架pytorch好嗎?

既然給出了和pytorch的比較視頻,就有網友發問了:

Neural Magic也使用python嗎?為什么一個比另一個快10倍以上?我不相信像pytorch這樣傳統的機器學習框架不會得到優化。兩種模型的實現是否相同?

公司官方人員也下場解釋了:

我們擁有專利技術,可以通過減少計算和內存移動來使稀疏網絡在CPU上更高效的運行。

雖然傳統的ML框架也能很好地實現簡單而高效的訓練過程。

但是,多加入一些優化的推理,可以實現更多的性能,尤其是在CPU上更明顯。

看來,有了以上強大的YOLOv3 模型工具和教程,用戶就可以在CPU上,以最小化的占用空間和GPU的速度來運行深度學習模型。

這樣有用的教程,你還在等什么?

希望教程能對大家有所幫助,歡迎在評論區分享交流訓練模型經驗~

最后介紹一下Neural Magic,有興趣的朋友可以去了解一下。

Neural Magic是一家什么樣的公司?

Neural Magic成立在馬薩諸塞州的劍橋。

創始人Nir Shavit和Alexander Matveev在MIT繪制大腦中的神經連接圖時,一直覺得GPU有許多限制。

因此他們停下來問自己兩個簡單的問題:

為什么深度學習需要GPU等專用硬件?

有什么更好的方法嗎?

畢竟,人腦可以通過廣泛使用稀疏性來減少神經網絡,而不是添加FLOPS來匹配神經網絡,從而滿足神經網絡的計算需求。

基于這種觀察和多年的多核計算經驗,他們采用了稀疏和量化深度學習網絡的技術,并使其能夠以GPU的速度或更高的速度在商用CPU上運行。

這樣,數據科學家在模型設計和輸入大小上就不需要再做妥協,也沒必要用稀缺且昂貴的GPU資源。

Brian Stevens

Neural Magic的CEO,Red Hat和Google Cloud的前CTO。

Nir Shavit

Neural Magic聯合創始人。

麻省理工學院教授,他目前的研究涉及為多處理器設計可伸縮軟件的技術,尤其是多核計算機的并發數據結構。

Alexander Matveev

Neural Magic首席技術官兼聯合創始人。

麻省理工學院前研究科學家,專門研究AI多核算法和系統。

參考鏈接:

[1]https://github.com/neuralmagic/sparseml/blob/main/integrations/ultralytics-yolov3/t2.utorials/sparsifying_yolov3_using_recipes.md

[2]https://neuralmagic.com/blog/sparsifying-yolov3-using-recipes-tutorial/

[3]https://arxiv.org/pdf/1804.02767.pdf

[4]https://wandb.ai/neuralmagic/yolov3-spp-lrelu-voc

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10902

    瀏覽量

    212996
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4774

    瀏覽量

    129350
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24829
  • voc
    voc
    +關注

    關注

    0

    文章

    105

    瀏覽量

    15727

原文標題:不用GPU,稀疏化也能加速你的YOLOv3深度學習模型

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【ELF 2學習板試用】ELF2開發板(飛凌嵌入式)搭建深度學習環境部署(RKNN環境部署)

    是 Rockchip 為其輕量級神經網絡處理單元(NPU)提供的一款工具包。它專注于簡化和加速深度學習模型在 Rockchip 硬件平臺上的部署和推理過程。與 RKNN-Toolki
    發表于 02-04 14:15

    采用華為云 Flexus 云服務器 X 實例部署 YOLOv3 算法完成目標檢測

    一、前言 1.1 開發需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務器 X 實例部署 YOLOv3 算法,完成圖像分析、目標檢測。 隨著計算機視覺技術的飛速發展,深度學習模型
    的頭像 發表于 01-02 12:00 ?118次閱讀
    采用華為云 Flexus 云服務器 X 實例部署 <b class='flag-5'>YOLOv3</b> 算法完成目標檢測

    Flexus X 實例 ultralytics 模型 yolov10 深度學習 AI 部署與應用

    前言: ???深度學習新紀元,828 B2B 企業節 Flexus X 實例特惠!想要高效訓練 YOLOv10 模型,實現精準圖像識別?Flexus X 以卓越算力,助您輕松駕馭大規模
    的頭像 發表于 12-24 12:24 ?382次閱讀
    Flexus X 實例 ultralytics <b class='flag-5'>模型</b> <b class='flag-5'>yolov</b>10 <b class='flag-5'>深度</b><b class='flag-5'>學習</b> AI 部署與應用

    GPU深度學習中的應用 GPUs在圖形設計中的作用

    隨著人工智能技術的飛速發展,深度學習作為其核心部分,已經成為推動技術進步的重要力量。GPU(圖形處理單元)在深度學習中扮演著至關重要的角色,
    的頭像 發表于 11-19 10:55 ?722次閱讀

    PyTorch GPU 加速訓練模型方法

    深度學習領域,GPU加速訓練模型已經成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作為一個流行的
    的頭像 發表于 11-05 17:43 ?651次閱讀

    GPU深度學習應用案例

    GPU深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是
    的頭像 發表于 10-27 11:13 ?502次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速
    的頭像 發表于 10-25 09:22 ?350次閱讀

    AI大模型深度學習的關系

    AI大模型深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大
    的頭像 發表于 10-23 15:25 ?1260次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發表于 10-17 10:07 ?262次閱讀

    FPGA做深度學習走多遠?

    ,共同進步。 歡迎加入FPGA技術微信交流群14群! 交流問題(一) Q:FPGA做深度學習走多遠?現在用FPGA做深度學習
    發表于 09-27 20:53

    深度學習模型量化方法

    深度學習模型量化是一種重要的模型輕量化技術,旨在通過減少網絡參數的比特寬度來減小模型大小和加速
    的頭像 發表于 07-15 11:01 ?556次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>量化方法

    深度學習中的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是
    的頭像 發表于 07-04 11:49 ?1956次閱讀

    新手小白怎么學GPU云服務器跑深度學習?

    新手小白想用GPU云服務器跑深度學習應該怎么做? 用個人主機通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動,如何實現更經濟便捷的實現GPU云服務器
    發表于 06-11 17:09

    模型時代,國產GPU面臨哪些挑戰

    ,國產GPU在不斷成長的過程中存在諸多挑戰。 ? 在大模型訓練上存在差距 ? 大語言模型是基于深度學習
    的頭像 發表于 04-03 01:08 ?4747次閱讀
    大<b class='flag-5'>模型</b>時代,國產<b class='flag-5'>GPU</b>面臨哪些挑戰

    FPGA在深度學習應用中或將取代GPU

    現場可編程門陣列 (FPGA) 解決了 GPU 在運行深度學習模型時面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業受益匪淺。英偉達 (Nvidia) 和 AMD 等公
    發表于 03-21 15:19
    风水24山走水| 鸿博娱乐场| 蓝盾百家乐官网赌场娱乐网规则| 百家乐存200送200| 大发888检测技能| 百家乐官网扑克片礼服| 威尼斯人娱乐cheng| 在线百家乐官网电脑| 足球博彩网站| 娱乐百家乐官网下载| 六合彩开奖公告| 百家乐翻天粤| 百家乐官网视频大厅| 打百家乐最好办法| 茶陵县| 真人百家乐策略| 百家乐官网路单破解软件| 大发888wofacai官网| 百家乐de概率| 百家乐官网好多假网站| 威尼斯人娱乐城 老品牌| 百家乐官网过滤软件| 百家乐官网风云论坛| 百家乐高额投注| 网络百家乐官网真人游戏| 大发888娱乐城出纳柜台| 百家乐的庄闲概率| 女性| 水果机破解器| 游戏机百家乐作弊| 百家乐官网投注很不错| 澳门博彩有限公司| 百家乐网站赌钱吗| 玩百家乐官网请高手指点| 好运来百家乐官网现金网| 德州扑克比赛视频| 网络百家乐怎么作弊| 百家乐官网桌手机套| 德州扑克和梭哈| 金博士百家乐娱乐城 | 公海百家乐的玩法技巧和规则|