天津时时彩计划群,现金网现金网开户现金网官网,澳门博彩咨询网3d(中国)·官方网站

目前在深度學習領域分類兩個派別，一派為學院派，研究強大、復雜的模型網絡和實驗方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩定、高效的落地在硬件平臺上，效率是其追求的目標。復雜的模型固然具有更好的性能，但是高額的存儲空間、計算資源消耗是使其難以有效的應用在各硬件平臺上的重要原因。所以，卷積神經網絡日益增長的深度和尺寸為深度學習在移動端的部署帶來了巨大的挑戰，深度學習模型壓縮與加速成為了學術界和工業界都重點關注的研究領域之一。本文主要介紹深度學習模型壓縮和加速算法的三個方向，分別為加速網絡結構設計、模型裁剪與稀疏化、量化加速。

I. 加速網絡設計

分組卷積

分組卷積即將輸入的feature maps分成不同的組（沿channel維度進行分組），然后對不同的組分別進行卷積操作，即每一個卷積核至于輸入的feature maps的其中一組進行連接，而普通的卷積操作是與所有的feature maps進行連接計算。分組數k越多，卷積操作的總參數量和總計算量就越少（減少k倍）。然而分組卷積有一個致命的缺點就是不同分組的通道間減少了信息流通，即輸出的feature maps只考慮了輸入特征的部分信息，因此在實際應用的時候會在分組卷積之后進行信息融合操作，接下來主要講兩個比較經典的結構，ShuffleNet[1]和MobileNet[2]結構。

1) ShuffleNet結構：

如上圖所示，圖a是一般的group convolution的實現效果，其造成的問題是，輸出通道只和輸入的某些通道有關，導致全局信息流通不暢，網絡表達能力不足。圖b就是shufflenet結構，即通過均勻排列，把group convolution后的feature map按通道進行均勻混合，這樣就可以更好的獲取全局信息了。圖c是操作后的等價效果圖。在分組卷積的時候，每一個卷積核操作的通道數減少，所以可以大量減少計算量。

2)MobileNet結構：

如上圖所示，mobilenet采用了depthwise separable convolutions的思想，采用depthwise (或叫channelwise)和1x1 pointwise的方法進行分解卷積。其中depthwise separable convolutions即對每一個通道進行卷積操作，可以看成是每組只有一個通道的分組卷積，最后使用開銷較小的1x1卷積進行通道融合，可以大大減少計算量。

分解卷積

分解卷積，即將普通的kxk卷積分解為kx1和1xk卷積，通過這種方式可以在感受野相同的時候大量減少計算量，同時也減少了參數量，在某種程度上可以看成是使用2k個參數模擬k*k個參數的卷積效果，從而造成網絡的容量減小，但是可以在較少損失精度的前提下，達到網絡加速的效果。

右圖是在圖像語義分割任務上取得非常好的效果的ERFNet[3]的主要模塊，稱為NonBottleNeck結構借鑒自ResNet[4]中的Non-Bottleneck結構，相應改進為使用分解卷積替換標準卷積，這樣可以減少一定的參數和計算量，使網絡更趨近于efficiency。

Bottleneck結構

右圖為ENet[5]中的Bottleneck結構，借鑒自ResNet中的Bottleneck結構，主要是通過1x1卷積進行降維和升維，能在一定程度上能夠減少計算量和參數量。其中1x1卷積操作的參數量和計算量少，使用其進行網絡的降維和升維操作（減少或者增加通道數）的開銷比較小，從而能夠達到網絡加速的目的。

C.ReLU[7]結構

C.ReLU來源于CNNs中間激活模式引發的。輸出節點傾向于是"配對的"，一個節點激活是另一個節點的相反面，即其中一半通道的特征是可以通過另外一半通道的特征生成的。根據這個觀察，C.ReLU減少一半輸出通道(output channels)的數量，然后通過其中一半通道的特征生成另一半特征，這里使用 negation使其變成雙倍，最后通過scale操作使得每個channel(通道)的斜率和激活閾值與其相反的channel不同。

SqueezeNet[8]結構

SqueezeNet思想非常簡單，就是將原來簡單的一層conv層變成兩層:squeeze層+expand層，各自帶上Relu激活層。在squeeze層里面全是1x1的卷積kernel，數量記為S11;在expand層里面有1x1和3x3的卷積kernel，數量分別記為E11和E33，要求S11 < input map number。expand層之后將 1x1和3x3的卷積output feature maps在channel維度拼接起來。

神經網絡搜索[18]

神經結構搜索（Neural Architecture Search，簡稱NAS）是一種自動設計神經網絡的技術，可以通過算法根據樣本集自動設計出高性能的網絡結構，在某些任務上甚至可以媲美人類專家的水準，甚至發現某些人類之前未曾提出的網絡結構，這可以有效的降低神經網絡的使用和實現成本。

NAS的原理是給定一個稱為搜索空間的候選神經網絡結構集合，用某種策略從中搜索出最優網絡結構。神經網絡結構的優劣即性能用某些指標如精度、速度來度量，稱為性能評估，可以通過NAS自動搜索出高效率的網絡結構。

本節主要介紹了模型模型設計的思路，同時對模型的加速設計以及相關缺陷進行分析。總的來說，加速網絡模型設計主要是探索最優的網絡結構，使得較少的參數量和計算量就能達到類似的效果。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3305

瀏覽量
49220
深度學習

深度學習

+關注

關注
73

文章
5513

瀏覽量
121546

原文標題：深度學習模型壓縮與加速綜述

文章出處：【微信號：Imgtec，微信公眾號：Imagination Tech】歡迎添加關注！文章轉載請注明出處。

深度學習模型的魯棒性優化

深度學習模型的魯棒性優化是一個復雜但至關重要的任務，它涉及多個方面的技術和策略。以下是一些關鍵的優化方法：一、數據預處理與增強數據清洗：去除數據中的噪聲和異常值，這是提高模型魯棒

發表于 11-11 10:25 ?383次閱讀

GPU深度學習應用案例

GPU在深度學習中的應用廣泛且重要，以下是一些GPU深度學習應用案例：一、圖像識別圖像識別是深度學習

發表于 10-27 11:13 ?504次閱讀

FPGA加速深度學習模型的案例

FPGA（現場可編程門陣列）加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速

發表于 10-25 09:22 ?354次閱讀

AI大模型與深度學習的關系

AI大模型與深度學習之間存在著密不可分的關系，它們互為促進，相輔相成。以下是對兩者關系的介紹：一、深度學習是AI大

發表于 10-23 15:25 ?1264次閱讀

深度學習GPU加速效果如何

圖形處理器（GPU）憑借其強大的并行計算能力，成為加速深度學習任務的理想選擇。

發表于 10-17 10:07 ?262次閱讀

深度學習模型有哪些應用場景

深度學習模型作為人工智能領域的重要分支，已經在多個應用場景中展現出其巨大的潛力和價值。這些應用不僅改變了我們的日常生活，還推動了科技進步和產業升級。以下將詳細探討深度

發表于 07-16 18:25 ?2243次閱讀

深度神經網絡模型量化的基本方法

盡量保持模型的性能。這一技術通過降低模型參數的位數來顯著減小模型的大小，加速推理過程，并降低能耗，從而有助于將深度

發表于 07-15 11:26 ?782次閱讀

深度學習模型量化方法

深度學習模型量化是一種重要的模型輕量化技術，旨在通過減少網絡參數的比特寬度來減小模型大小和加速推

發表于 07-15 11:01 ?556次閱讀

深度學習模型中的過擬合與正則化

在深度學習的廣闊領域中，模型訓練的核心目標之一是實現對未知數據的準確預測。然而，在實際應用中，我們經常會遇到一個問題——過擬合（Overfitting）。過擬合是指模型在訓練數據上表現

發表于 07-09 15:56 ?1126次閱讀

深度學習中的時間序列分類方法

的發展，基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習在時間序列分類中的應用進行綜述，探討常用

發表于 07-09 15:54 ?1168次閱讀

深度學習中的無監督學習方法綜述

深度學習作為機器學習領域的一個重要分支，近年來在多個領域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領域。然而，深度學習

發表于 07-09 10:50 ?943次閱讀

深度學習中的模型權重

在深度學習這一充滿無限可能性的領域中，模型權重（Weights）作為其核心組成部分，扮演著至關重要的角色。它們不僅是模型學習的基石，更是

發表于 07-04 11:49 ?1961次閱讀

深度學習模型訓練過程詳解

深度學習模型訓練是一個復雜且關鍵的過程，它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度學習模型

發表于 07-01 16:13 ?1503次閱讀

深度學習的模型優化與調試方法

深度學習模型在訓練過程中，往往會遇到各種問題和挑戰，如過擬合、欠擬合、梯度消失或爆炸等。因此，對深度學習

發表于 07-01 11:41 ?1002次閱讀

【大語言模型：原理與工程實踐】核心技術綜述

的具體需求，這通常需要較少量的標注數據。多任務學習和遷移學習: LLMs利用在預訓練中積累的知識，可以通過遷移學習在相關任務上快速適應，有時還可以在一個模型中同時處理多個任務。

發表于 05-05 10:56

那曲檬骨新材料有限公司

搜索歷史

深度學習模型壓縮與加速綜述

評論

深度學習模型的魯棒性優化

GPU深度學習應用案例

FPGA加速深度學習模型的案例

AI大模型與深度學習的關系

深度學習GPU加速效果如何

深度學習模型有哪些應用場景

深度神經網絡模型量化的基本方法

深度學習模型量化方法

深度學習模型中的過擬合與正則化

深度學習中的時間序列分類方法

深度學習中的無監督學習方法綜述

深度學習中的模型權重

深度學習模型訓練過程詳解

深度學習的模型優化與調試方法

【大語言模型：原理與工程實踐】核心技術綜述