最新棋牌水果机游戏,注册送18体验金,播放体育5+频道(中国)·官方网站

1、傳統的自然語言處理模型

1）傳統的詞袋模型或者連續詞袋模型（CBOW）都可以通過構建一個全連接的神經網絡對句子進行情感標簽的分類，但是這樣存在一個問題，我們通過激活函數可以讓某些結點激活（例如一個句子里”not”,”hate”這樣的較強的特征詞），但是由于在這樣網絡構建里，句子中詞語的順序被忽略，也許同樣兩個句子都出現了not和hate但是一個句子（I do not hate this movie）表示的是good的情感，另一個句子（I hate this movie and will not choose it）表示的是bad的情感。其實很重要的一點是在剛才上述模型中我們無法捕獲像not hate這樣由連續兩個詞所構成的關鍵特征的詞的含義。

2）在語言模型里n-gram模型是可以用來解決上面的問題的，想法其實就是將連續的兩個詞作為一個整體納入到模型中，這樣確實能夠解決我們剛才提出的問題，加入bi-gram，tri-gram可以讓我們捕捉到例如“don’t love”，“not the best”。但是新的問題又來了，如果我們使用多元模型，實際訓練時的參數是一個非常大的問題，因為假設你有20000個詞，加入bi-gram實際上你就要有400000000個詞，這樣參數訓練顯然是爆炸的。另外一點，相似的詞語在這樣的模型中不能共享例如參數權重等，這樣就會導致相似詞無法獲得交互信息。

2、自然語言處理中的卷積神經網絡

在圖像中卷積核通常是對圖像的一小塊區域進行計算，而在文本中，一句話所構成的詞向量作為輸入。每一行代表一個詞的詞向量，所以在處理文本時，卷積核通常覆蓋上下幾行的詞，所以此時卷積核的寬度與輸入的寬度相同，通過這樣的方式，我們就能夠捕捉到多個連續詞之間的特征（只要通過設置卷積核的尺寸，卷積核的寬度一般和詞向量的長度一致，長度可以去1,2,3這類的值，當取3時就會將3個連續詞的特征表示出來），并且能夠在同一類特征計算時中共享權重。如下圖所示

如上圖所示，不同長度的卷積核，會獲得不同長度的輸出值，但在之后的池化中又會得到相同的長度（比如上面的深紅色的卷積核是4 × 5，對于輸入值為7 × 5的輸入值，卷積之后的輸出值就是4 × 1，最大池化之后就是1 × 1；深綠色的卷積核是3 × 5，卷積之后的輸出值是5 × 1，最大池化之后就是1 × 1），最后將所有池化后的值組合在一起，這樣有一點好處，無論輸入值的大小是否相同（輸入值行一般不相等，對于輸入值列是詞向量的長度，一般都是相等，但是行是和文本中詞的數量相關的），要用相同數量的卷積核進行卷積，之后再池化就會獲得相同長度的向量（向量的長度和卷積核的數量相等），這樣再之后就可以用全連接層了（全連接層的輸入值的向量大小必須是一致的）。

3、卷積層的最大池化問題

MaxPooling Over Time是NLP中CNN模型中最常見的一種下采樣操作。意思是對于某個Filter抽取到若干特征值，只取其中得分最大的那個值作為Pooling層保留值，其它特征值全部拋棄，值最大代表只保留這些特征中最強的，而拋棄其它弱的此類特征（正如上圖所示的那樣）。

CNN中采用Max Pooling操作有幾個好處：

1）這個操作可以保證特征的位置與旋轉不變性，因為不論這個強特征在哪個位置出現，都會不考慮其出現位置而能把它提出來。對于圖像處理來說這種位置與旋轉不變性是很好的特性，但是對于NLP來說，這個特性其實并不一定是好事，因為在很多NLP的應用場合，特征的出現位置信息是很重要的，比如主語出現位置一般在句子頭，賓語一般出現在句子尾等等，這些位置信息其實有時候對于分類任務來說還是很重要的，但是Max Pooling 基本把這些信息拋掉了。

2）MaxPooling能減少模型參數數量，有利于減少模型過擬合問題。因為經過Pooling操作后，往往把2D（圖像中）或者1D（自然語言中）的數組轉換為單一數值，這樣對于后續的Convolution層或者全聯接隱層來說無疑單個Filter的參數或者隱層神經元個數就減少了。

3）對于NLP任務來說，Max Pooling有個額外的好處；在此處，可以把變長的輸入X整理成固定長度的輸入。因為CNN最后往往會接全聯接層，而其神經元個數是需要事先定好的，如果輸入是不定長的那么很難設計網絡結構。

但是，CNN模型采取MaxPooling Over Time也有一些值得注意的缺點：首先就如上所述，特征的位置信息在這一步驟完全丟失。在卷積層其實是保留了特征的位置信息的，但是通過取唯一的最大值，現在在Pooling層只知道這個最大值是多少，但是其出現位置信息并沒有保留；另外一個明顯的缺點是：有時候有些強特征會出現多次，比如我們常見的TF.IDF公式，TF就是指某個特征出現的次數，出現次數越多說明這個特征越強，但是因為Max Pooling只保留一個最大值，所以即使某個特征出現多次，現在也只能看到一次，就是說同一特征的強度信息丟失了。這是Max Pooling Over Time典型的兩個缺點。

針對上面提出的兩個缺點，通常的解決辦法是下面兩種池化方法

K-Max Pooling

K-MaxPooling的核心思想是：原先的Max Pooling Over Time從Convolution層一系列特征值中只取最強的那個值，K-Max Pooling可以取所有特征值中得分在Top –K的值，并保留這些特征值原始的先后順序，就是說通過多保留一些特征信息供后續階段使用。如下圖所示

很明顯，K-Max Pooling可以表達同一類特征出現多次的情形，即可以表達某類特征的強度；另外，因為這些Top K特征值的相對順序得以保留，所以應該說其保留了部分位置信息，但是這種位置信息只是特征間的相對順序，而非絕對位置信息。

Chunk-Max Pooling

Chunk-MaxPooling的核心思想是：把某個Filter對應的Convolution層的所有特征向量進行分段，切割成若干段后，在每個分段里面各自取得一個最大特征值，比如將某個Filter的特征向量切成3個Chunk，那么就在每個Chunk里面取一個最大值，于是獲得3個特征值。如下圖所示，不同顏色代表不同段

Chunk-Max Pooling思路類似于K-Max Pooling，因為它也是從Convolution層取出了K個特征值，但是兩者的主要區別是：K-Max Pooling是一種全局取Top K特征的操作方式，而Chunk-Max Pooling則是先分段，在分段內包含特征數據里面取最大值，所以其實是一種局部Top K的特征抽取方式。

至于這個Chunk怎么劃分，可以有不同的做法，比如可以事先設定好段落個數，這是一種靜態劃分Chunk的思路；也可以根據輸入的不同動態地劃分Chunk間的邊界位置，可以稱之為動態Chunk-Max方法。事實上對于K-Max Pooling也有動態的去獲取K的值的方法，表達式如下

s代表的是句子長度，L代表總的卷積層的個數，l代表的是當前是在幾個卷積層，所以可以看出這里的k是隨著句子的長度和網絡深度而改變。

Chunk-Max Pooling很明顯也是保留了多個局部Max特征值的相對順序信息，盡管并沒有保留絕對位置信息，但是因為是先劃分Chunk再分別取Max值的，所以保留了比較粗粒度的模糊的位置信息；當然，如果多次出現強特征，則也可以捕獲特征強度。

如果分類所需要的關鍵特征的位置信息很重要，那么類似Chunk-Max Pooling這種能夠粗粒度保留位置信息的機制應該能夠對分類性能有一定程度的提升作用；但是對于很多分類問題，估計Max-Pooling over time就足夠了。

4、卷積神經網絡在自然語言處理中的應用

最適合CNNs的莫過于分類任務，如語義分析、垃圾郵件檢測和話題分類。卷積運算和池化會丟失局部區域某些單詞的順序信息，因此純CNN的結構框架不太適用于PoS Tagging和Entity Extraction等順序標簽任務。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4779

瀏覽量
101168
cnn

cnn

+關注

關注
3

文章
353

瀏覽量
22334
自然語言處理

自然語言處理

+關注

關注
1

文章
619

瀏覽量
13646

原文標題：自然語言處理之卷積神經網絡應用

文章出處：【微信號：Imgtec，微信公眾號：Imagination Tech】歡迎添加關注！文章轉載請注明出處。

卷積神經網絡模型發展及應用

網絡 GhostNet。由于卷積神經網絡的一系列突破性研究成果，并根據不同的任務需求不斷改進，使其在目標檢測、語義分割、自然語言處理等不

發表于 08-02 10:39

淺談圖神經網絡在自然語言處理中的應用簡述

近幾年，神經網絡因其強大的表征能力逐漸取代傳統的機器學習成為自然語言處理任務的基本模型。然而經典的神經網絡模型只能處理歐氏空間中的數據，

發表于 04-26 14:57 ?3352次閱讀

淺談圖<b class='flag-5'>神經網絡</b>在<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b><b class='flag-5'>中</b>的應用簡述

卷積神經網絡結構

卷積神經網絡結構卷積神經網絡(Convolutional Neural Network, CNN)是一種前饋神經網絡，常用于圖像

發表于 08-17 16:30 ?1289次閱讀

卷積神經網絡的應用卷積神經網絡通常用來處理什么

神經網絡，卷積神經網絡廣泛用于圖像識別、自然語言處理、視頻處理等方面。本文將對

發表于 08-21 16:41 ?5064次閱讀

卷積神經網絡概述卷積神經網絡的特點 cnn卷積神經網絡的優點

和高效的處理方式，CNN已經成為圖像識別、語音識別和自然語言處理等領域中的優選技術。CNN對于處理基于網格結構的數據具有天然的優勢，因此在處理

發表于 08-21 16:41 ?3140次閱讀

卷積神經網絡模型原理卷積神經網絡模型結構

數據的不同方面，從而獲得預測和最終的表??現。本文將提供有關卷積神經網絡模型的工作原理和結構的詳細信息，包括其在圖像、語音和自然語言處理等不

發表于 08-21 16:41 ?1082次閱讀

卷積神經網絡的工作原理卷積神經網絡通俗解釋

。CNN可以幫助人們實現許多有趣的任務，如圖像分類、物體檢測、語音識別、自然語言處理和視頻分析等。本文將詳細介紹卷積

發表于 08-21 16:49 ?3895次閱讀

卷積神經網絡模型搭建

卷積神經網絡模型搭建卷積神經網絡模型是一種深度學習算法。它已經成為了計算機視覺和自然語言處理等

發表于 08-21 17:11 ?1013次閱讀

卷積神經網絡主要包括哪些卷積神經網絡組成部分

卷積神經網絡主要包括哪些卷積神經網絡組成部分卷積神經網絡（CNN）是一類廣泛應用于計算機視覺

發表于 08-21 17:15 ?1803次閱讀

神經網絡在自然語言處理中的應用

自然語言處理（NLP）是人工智能領域中的一個重要分支，它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術的飛速發展，神經網絡在自然語

發表于 07-01 14:09 ?594次閱讀

卷積神經網絡的原理是什么

卷積神經網絡（Convolutional Neural Network，簡稱CNN）是一種深度學習模型，廣泛應用于圖像識別、語音識別、自然語言處理等領域。本文將

發表于 07-02 14:44 ?806次閱讀

卷積神經網絡訓練的是什么

卷積神經網絡（Convolutional Neural Networks，簡稱CNN）是一種深度學習模型，廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將

發表于 07-03 09:15 ?517次閱讀

卷積神經網絡的實現原理

卷積神經網絡（Convolutional Neural Networks，簡稱CNN）是一種深度學習模型，廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將

發表于 07-03 10:49 ?655次閱讀

用于自然語言處理的神經網絡有哪些

取得了顯著進展，成為處理自然語言任務的主要工具。本文將詳細介紹幾種常用于NLP的神經網絡模型，包括遞歸神

發表于 07-03 16:17 ?1404次閱讀

卷積神經網絡在自然語言處理中的應用

。卷積神經網絡的基本原理卷積神經網絡是一種前饋神經網絡，它通過卷積層來提取輸入數據的特征。在

發表于 11-15 14:58 ?343次閱讀

那曲檬骨新材料有限公司

搜索歷史

自然語言處理中的卷積神經網絡的詳細資料介紹和應用

評論

卷積神經網絡模型發展及應用

淺談圖神經網絡在自然語言處理中的應用簡述

卷積神經網絡結構

卷積神經網絡的應用卷積神經網絡通常用來處理什么

卷積神經網絡概述卷積神經網絡的特點 cnn卷積神經網絡的優點

卷積神經網絡模型原理卷積神經網絡模型結構

卷積神經網絡的工作原理卷積神經網絡通俗解釋

卷積神經網絡模型搭建

卷積神經網絡主要包括哪些卷積神經網絡組成部分

神經網絡在自然語言處理中的應用

卷積神經網絡的原理是什么

卷積神經網絡訓練的是什么

卷積神經網絡的實現原理

用于自然語言處理的神經網絡有哪些

卷積神經網絡在自然語言處理中的應用