日本一级a爱免费,久久毛片免费基地

神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的載體，而神經(jīng)網(wǎng)絡(luò)模型中，最經(jīng)典非RNN模型所屬，盡管它不完美，但它具有學(xué)習(xí)歷史信息的能力。后面不管是encode-decode 框架，還是注意力模型，以及自注意力模型，以及更加強(qiáng)大的Bert模型家族，都是站在RNN的肩上，不斷演化、變強(qiáng)的。

這篇文章，闡述了RNN的方方面面，包括模型結(jié)構(gòu)，優(yōu)缺點(diǎn)，RNN模型的幾種應(yīng)用，RNN常使用的激活函數(shù)，RNN的缺陷，以及GRU，LSTM是如何試圖解決這些問題，RNN變體等。

這篇文章最大特點(diǎn)是圖解版本，其次語言簡練，總結(jié)全面。

概述

傳統(tǒng)RNN的體系結(jié)構(gòu)。Recurrent neural networks，也稱為RNNs，是一類允許先前的輸出用作輸入，同時具有隱藏狀態(tài)的神經(jīng)網(wǎng)絡(luò)。它們通常如下所示：

對于每一時步 , 激活函數(shù) ，輸出被表達(dá)為:

這里是時間維度網(wǎng)絡(luò)的共享權(quán)重系數(shù)

是激活函數(shù)

下表總結(jié)了典型RNN架構(gòu)的優(yōu)缺點(diǎn)：

優(yōu)點(diǎn)	缺點(diǎn)
處理任意長度的輸入	計算速度慢
模型形狀不隨輸入長度增加	難以獲取很久以前的信息
計算考慮了歷史信息	無法考慮當(dāng)前狀態(tài)的任何未來輸入
權(quán)重隨時間共享

RNNs應(yīng)用

RNN模型主要應(yīng)用于自然語言處理和語音識別領(lǐng)域。下表總結(jié)了不同的應(yīng)用：

一對一

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)

一對多

音樂生成

多對一

機(jī)器翻譯

RNN 類型圖解例子

對于RNN網(wǎng)絡(luò)，所有時間步的損失函數(shù) 是根據(jù)每個時間步的損失定義的，如下所示：損失函數(shù)

時間反向傳播

在每個時間點(diǎn)進(jìn)行反向傳播。在時間步，損失相對于權(quán)重矩陣的偏導(dǎo)數(shù)表示如下：

處理長短依賴

常用激活函數(shù)

RNN模塊中最常用的激活函數(shù)描述如下：

SigmoidTanhRELU

梯度消失/爆炸

在RNN中經(jīng)常遇到梯度消失和爆炸現(xiàn)象。之所以會發(fā)生這種情況，是因?yàn)楹茈y捕捉到長期的依賴關(guān)系，因?yàn)槌朔ㄌ荻瓤梢噪S著層的數(shù)量呈指數(shù)遞減/遞增。

梯度修剪

梯度修剪是一種技術(shù)，用于執(zhí)行反向傳播時，有時遇到的梯度爆炸問題。通過限制梯度的最大值，這種現(xiàn)象在實(shí)踐中得以控制。

門的類型

為了解決消失梯度問題，在某些類型的RNN中使用特定的門，并且通常有明確的目的。它們通常標(biāo)注為，等于：

其中，是特定于門的系數(shù)，是sigmoid函數(shù)。主要內(nèi)容總結(jié)如下表：

Gated Recurrent Unit（GRU）和長-短期記憶單元（LSTM）處理傳統(tǒng)RNNs遇到的消失梯度問題，LSTM是GRU的推廣。下表總結(jié)了每種結(jié)構(gòu)的特征方程：GRU/LSTM

注：符號表示兩個向量之間按元素相乘。

RNN的變體

下表總結(jié)了其他常用的RNN模型：

Bidirectional （BRNN）Deep （DRNN）

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4237

瀏覽量
61969
rnn

rnn

+關(guān)注

關(guān)注
0

文章
76

瀏覽量
6855

原文標(biāo)題：神經(jīng)網(wǎng)絡(luò)RNN圖解！

文章出處：【微信號：tyutcsplab，微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AI大模型與小模型的優(yōu)缺點(diǎn)

在人工智能（AI）的廣闊領(lǐng)域中，模型作為算法與數(shù)據(jù)之間的橋梁，扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度，我們可以將其大致分為AI大模型和小模型。這兩種

發(fā)表于 07-10 10:39 ?1472次閱讀

CNN與RNN的關(guān)系?

在深度學(xué)習(xí)的廣闊領(lǐng)域中，卷積神經(jīng)網(wǎng)絡(luò)（CNN）和循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）是兩種極為重要且各具特色的神經(jīng)網(wǎng)絡(luò)模型。它們各自在圖像處理、自然語言處理等領(lǐng)域展現(xiàn)出卓越的性能。本文將從概念、原理、應(yīng)用場景及代碼示例等方面詳細(xì)探討CNN與

發(fā)表于 07-08 16:56 ?311次閱讀

rnn是什么神經(jīng)網(wǎng)絡(luò)模型

RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型，它能夠處理序列數(shù)據(jù)，并對序列中的元素進(jìn)行建模。RNN在自然語言處理、語音識別、

發(fā)表于 07-05 09:50 ?392次閱讀

rnn是什么神經(jīng)網(wǎng)絡(luò)

時間步的輸入，從而實(shí)現(xiàn)對時間序列數(shù)據(jù)的處理。RNN的循環(huán)結(jié)構(gòu)使得網(wǎng)絡(luò)能夠在處理當(dāng)前時間步的數(shù)據(jù)時，考慮到之前

發(fā)表于 07-05 09:49 ?369次閱讀

rnn神經(jīng)網(wǎng)絡(luò)模型原理

的應(yīng)用。本文將介紹RNN的原理、結(jié)構(gòu)、優(yōu)化方法以及實(shí)際應(yīng)用。 RNN的基本原理 1.1 循環(huán)結(jié)構(gòu) RNN

發(fā)表于 07-04 15:40 ?370次閱讀

RNN神經(jīng)網(wǎng)絡(luò)適用于什么

RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)，它可以處理序列數(shù)據(jù)，具有記憶功能。RNN在許多領(lǐng)域都有廣泛的應(yīng)用，以下是一些RNN

發(fā)表于 07-04 15:04 ?496次閱讀

rnn神經(jīng)網(wǎng)絡(luò)基本原理

RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)，它能夠處理序列數(shù)據(jù)，并且能夠捕捉時間序列數(shù)據(jù)中的動態(tài)特征。RNN在自然語言處理、語音識別、時間

發(fā)表于 07-04 15:02 ?482次閱讀

遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、特點(diǎn)、優(yōu)缺點(diǎn)及適用場景

識別、時間序列分析等領(lǐng)域有著廣泛的應(yīng)用。本文將詳細(xì)介紹遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、特點(diǎn)、優(yōu)缺點(diǎn)以及適用場景。一、遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 基本

發(fā)表于 07-04 14:52 ?516次閱讀

循環(huán)神經(jīng)網(wǎng)絡(luò)有哪些基本模型

循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Networks，簡稱RNN）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)，它能夠處理序列數(shù)據(jù)，并且能夠捕捉序列數(shù)據(jù)中的時序信息。RNN的基本模型有很多

發(fā)表于 07-04 14:43 ?291次閱讀

什么是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))？RNN的基本原理和優(yōu)缺點(diǎn)

的時序信息和語義信息。RNN的提出基于記憶模型的想法，期望網(wǎng)絡(luò)能夠記住前面出現(xiàn)的特征，并依據(jù)這些特征推斷后續(xù)的結(jié)果。由于其獨(dú)特的循環(huán)結(jié)構(gòu)，RNN在自然語言處理（NLP）、語音識別、時間

發(fā)表于 07-04 11:48 ?1535次閱讀

NLP模型中RNN與CNN的選擇

在NLP中的應(yīng)用場景、工作原理、優(yōu)缺點(diǎn)，以及在選擇時應(yīng)考慮的關(guān)鍵因素，以期為讀者提供一個全面而深入的理解。

發(fā)表于 07-03 15:59 ?208次閱讀

數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)有哪些

、預(yù)測分析等。然而，神經(jīng)網(wǎng)絡(luò)模型也存在一些優(yōu)缺點(diǎn)。本文將詳細(xì)分析神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)。一、優(yōu)點(diǎn)

發(fā)表于 07-02 11:36 ?581次閱讀

大語言模型：原理與工程時間+小白初識大語言模型

解鎖我理解的是基于深度學(xué)習(xí)，需要訓(xùn)練各種數(shù)據(jù)知識最后生成自己的的語言理解和能力的交互模型。對于常說的RNN是處理短序列的數(shù)據(jù)時表現(xiàn)出色，耳真正厲害的是Transformer，此框架被推出后直接

發(fā)表于 05-12 23:57

什么是RNN （循環(huán)神經(jīng)網(wǎng)絡(luò)）？

循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 是一種深度學(xué)習(xí)結(jié)構(gòu)，它使用過去的信息來提高網(wǎng)絡(luò)處理當(dāng)前和將來輸入的性能。RNN 的獨(dú)特之處在于該網(wǎng)絡(luò)包含隱藏狀態(tài)和循環(huán)。

發(fā)表于 02-29 14:56 ?3418次閱讀

精選 25 個 RNN 問題

本文來源：MomodelAI循環(huán)神經(jīng)網(wǎng)絡(luò)是一類人工神經(jīng)網(wǎng)絡(luò)，其中節(jié)點(diǎn)之間的連接可以創(chuàng)建一個循環(huán)，允許某些節(jié)點(diǎn)的輸出影響對相同節(jié)點(diǎn)的后續(xù)輸入。涉及序列的任務(wù)，如自然語言處理、語音識別和時間序列分析

發(fā)表于 12-15 08:28 ?543次閱讀

搜索歷史

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用

評論

AI大模型與小模型的優(yōu)缺點(diǎn)

CNN與RNN的關(guān)系?

rnn是什么神經(jīng)網(wǎng)絡(luò)模型

rnn是什么神經(jīng)網(wǎng)絡(luò)

rnn神經(jīng)網(wǎng)絡(luò)模型原理

RNN神經(jīng)網(wǎng)絡(luò)適用于什么

rnn神經(jīng)網(wǎng)絡(luò)基本原理

遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、特點(diǎn)、優(yōu)缺點(diǎn)及適用場景

循環(huán)神經(jīng)網(wǎng)絡(luò)有哪些基本模型

什么是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))？RNN的基本原理和優(yōu)缺點(diǎn)

NLP模型中RNN與CNN的選擇

數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)有哪些

大語言模型：原理與工程時間+小白初識大語言模型

什么是RNN （循環(huán)神經(jīng)網(wǎng)絡(luò)）？

精選 25 個 RNN 問題

搜索歷史

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用

評論

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用