娱乐场所应建立什么制度发现娱乐场所内有毒品违法犯罪活动 ,棋牌陪玩兼职,优惠大厅申请怎么写范文模板下载 (中国)·官方网站

神經網絡是深度學習的載體，而神經網絡模型中，最經典非RNN模型所屬，盡管它不完美，但它具有學習歷史信息的能力。后面不管是encode-decode 框架，還是注意力模型，以及自注意力模型，以及更加強大的Bert模型家族，都是站在RNN的肩上，不斷演化、變強的。

這篇文章，闡述了RNN的方方面面，包括模型結構，優缺點，RNN模型的幾種應用，RNN常使用的激活函數，RNN的缺陷，以及GRU，LSTM是如何試圖解決這些問題，RNN變體等。

這篇文章最大特點是圖解版本，其次語言簡練，總結全面。

概述

傳統RNN的體系結構。Recurrent neural networks，也稱為RNNs，是一類允許先前的輸出用作輸入，同時具有隱藏狀態的神經網絡。它們通常如下所示：

對于每一時步, 激活函數，輸出被表達為：

這里是時間維度網絡的共享權重系數 ?是激活函數

下表總結了典型RNN架構的優缺點：

優點	缺點
處理任意長度的輸入	計算速度慢
模型形狀不隨輸入長度增加	難以獲取很久以前的信息
計算考慮了歷史信息	無法考慮當前狀態的任何未來輸入
權重隨時間共享

RNNs應用

RNN模型主要應用于自然語言處理和語音識別領域。下表總結了不同的應用：

1對1

	傳統神經網絡
1對多

	音樂生成
多對1

	情感分類
多對多

	命名實體識別
多對多

RNN 類型	圖解	例子
	機器翻譯

損失函數對于RNN網絡，所有時間步的損失函數是根據每個時間步的損失定義的，如下所示：

時間反向傳播

在每個時間點進行反向傳播。在時間步，損失相對于權重矩陣的偏導數表示如下：

處理長短依賴

常用激活函數

RNN模塊中最常用的激活函數描述如下：

Sigmoid	Tanh	RELU

梯度消失/爆炸

在RNN中經常遇到梯度消失和爆炸現象。之所以會發生這種情況，是因為很難捕捉到長期的依賴關系，因為乘法梯度可以隨著層的數量呈指數遞減/遞增。

梯度修剪梯度修剪是一種技術，用于執行反向傳播時，有時遇到的梯度爆炸問題。通過限制梯度的最大值，這種現象在實踐中得以控制。

門的類型

為了解決消失梯度問題，在某些類型的RNN中使用特定的門，并且通常有明確的目的。它們通常標注為，等于：

其中，是特定于門的系數，是sigmoid函數。主要內容總結如下表：

門的種類	作用	應用
更新門	過去對現在有多重要？	GRU, LSTM
關聯門	丟棄過去信息?	GRU, LSTM
遺忘門	是不是擦除一個單元?	LSTM
輸出門	暴露一個門的多少?	LSTM

GRU/LSTM Gated Recurrent Unit（GRU）和長-短期記憶單元（LSTM）處理傳統RNNs遇到的消失梯度問題，LSTM是GRU的推廣。下表總結了每種結構的特征方程：

注：符號表示兩個向量之間按元素相乘。

RNN的變體

下表總結了其他常用的RNN模型：

原文標題：神經網絡RNN圖解

文章出處：【微信公眾號：Imagination Tech】歡迎添加關注！文章轉載請注明出處。

責任編輯:haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4779

瀏覽量
101165
深度學習

深度學習

+關注

關注
73

文章
5513

瀏覽量
121544

原文標題：神經網絡RNN圖解

文章出處：【微信號：Imgtec，微信公眾號：Imagination Tech】歡迎添加關注！文章轉載請注明出處。

RNN模型與傳統神經網絡的區別

神經網絡是機器學習領域中的一種強大工具，它們能夠模擬人腦處理信息的方式。隨著技術的發展，神經網絡的類型也在不斷增加，其中循環神經網絡（RNN）和傳統

發表于 11-15 09:42 ?466次閱讀

LSTM神經網絡與傳統RNN的區別

在深度學習領域，循環神經網絡（RNN）因其能夠處理序列數據而受到廣泛關注。然而，傳統RNN在處理長序列時存在梯度消失或梯度爆炸的問題。為了解決這一問題，LSTM（長短期記憶）神經網絡應

發表于 11-13 09:58 ?460次閱讀

rnn是遞歸神經網絡還是循環神經網絡

RNN（Recurrent Neural Network）是循環神經網絡，而非遞歸神經網絡。循環神經網絡是一種具有時間序列特性的神經網絡，能

發表于 07-05 09:52 ?652次閱讀

rnn是什么神經網絡模型

RNN（Recurrent Neural Network，循環神經網絡）是一種具有循環結構的神經網絡模型，它能夠處理序列數據，并對序列中的元素進行建模。

發表于 07-05 09:50 ?700次閱讀

rnn是什么神經網絡

RNN（Recurrent Neural Network，循環神經網絡）是一種具有循環連接的神經網絡，它能夠處理序列數據，并且具有記憶能力。與傳統的前饋神經網絡（Feedforward

發表于 07-05 09:49 ?784次閱讀

rnn神經網絡模型原理

RNN（Recurrent Neural Network，循環神經網絡）是一種具有循環結構的神經網絡，它能夠處理序列數據，具有記憶功能。RNN在自然語言處理、語音識別、時間序列預測等領

發表于 07-04 15:40 ?686次閱讀

RNN神經網絡適用于什么

RNN（Recurrent Neural Network，循環神經網絡）是一種具有循環結構的神經網絡，它可以處理序列數據，具有記憶功能。RNN在許多領域都有廣泛的應用，以下是一些

發表于 07-04 15:04 ?1062次閱讀

rnn神經網絡基本原理

RNN（Recurrent Neural Network，循環神經網絡）是一種具有循環結構的神經網絡，它能夠處理序列數據，并且能夠捕捉時間序列數據中的動態特征。RNN在自然語言處理、語

發表于 07-04 15:02 ?792次閱讀

遞歸神經網絡是循環神經網絡嗎

遞歸神經網絡（Recurrent Neural Network，簡稱RNN）和循環神經網絡（Recurrent Neural Network，簡稱RNN）實際上是同一個概念，只是不同的

發表于 07-04 14:54 ?873次閱讀

循環神經網絡有哪些基本模型

循環神經網絡（Recurrent Neural Networks，簡稱RNN）是一種具有循環結構的神經網絡，它能夠處理序列數據，并且能夠捕捉序列數據中的時序信息。RNN的基本

發表于 07-04 14:43 ?502次閱讀

循環神經網絡的基本原理是什么

結構具有循環，能夠將前一個時間步的信息傳遞到下一個時間步，從而實現對序列數據的建模。本文將介紹循環神經網絡的基本原理。 RNN的基本結構 1.1 神經元模型

發表于 07-04 14:26 ?768次閱讀

什么是RNN(循環神經網絡)？RNN的基本原理和優缺點

RNN（Recurrent Neural Network，循環神經網絡）是一種專門用于處理序列數據的神經網絡結構，它能夠在序列的演進方向上進行遞歸，并通過所有節點（循環單元）的鏈式連接來捕捉序列中

發表于 07-04 11:48 ?4230次閱讀

GRU是什么？GRU模型如何讓你的神經網絡更聰明掌握時間掌握未來

適用于處理圖像識別和計算機視覺任務。今天要給大家介紹一位新朋友，名為GRU。 Gated RecurrentUnit（GRU）是一種用于處理序列數據的循環神經網絡（RNN）模型。先來

發表于 06-13 11:42 ?2063次閱讀

助聽器降噪神經網絡模型

抑制任務是語音增強領域的一個重要學科, 隨著深度神經網絡的興起，提出了幾種基于深度模型的音頻處理新方法[1,2,3,4]。然而，這些通常是為離線處理而開發的，不需要考慮實時性。當使用神經網絡

發表于 05-11 17:15

什么是RNN （循環神經網絡）？

循環神經網絡 (RNN) 是一種深度學習結構，它使用過去的信息來提高網絡處理當前和將來輸入的性能。RNN 的獨特之處在于該網絡包含隱藏狀態和

發表于 02-29 14:56 ?4198次閱讀

那曲檬骨新材料有限公司

搜索歷史

神經網絡中最經典的RNN模型介紹

評論

RNN模型與傳統神經網絡的區別

LSTM神經網絡與傳統RNN的區別

rnn是遞歸神經網絡還是循環神經網絡

rnn是什么神經網絡模型

rnn是什么神經網絡

rnn神經網絡模型原理

RNN神經網絡適用于什么

rnn神經網絡基本原理

遞歸神經網絡是循環神經網絡嗎

循環神經網絡有哪些基本模型

循環神經網絡的基本原理是什么

什么是RNN(循環神經網絡)？RNN的基本原理和優缺點

GRU是什么？GRU模型如何讓你的神經網絡更聰明掌握時間掌握未來

助聽器降噪神經網絡模型

什么是RNN （循環神經網絡）？