那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自然語言處理的ELMO使用

電子工程師 ? 來源:工程師曾玲 ? 2019-05-02 14:32 ? 次閱讀

1、概述

word embedding 是現(xiàn)在自然語言處理中最常用的 word representation 的方法,常用的word embedding 是word2vec的方法,然而word2vec本質(zhì)上是一個(gè)靜態(tài)模型,也就是說利用word2vec訓(xùn)練完每個(gè)詞之后,詞的表示就固定了,之后使用的時(shí)候,無論新句子上下文的信息是什么,這個(gè)詞的word embedding 都不會(huì)跟隨上下文的場(chǎng)景發(fā)生變化,這種情況對(duì)于多義詞是非常不友好的。例如英文中的 Bank這個(gè)單詞,既有河岸的意思,又有銀行的意思,但是在利用word2vec進(jìn)行word embedding 預(yù)訓(xùn)練的時(shí)候會(huì)獲得一個(gè)混合多種語義的固定向量表示。即使在根據(jù)上下文的信息能明顯知道是“銀行”的情況下,它對(duì)應(yīng)的word embedding的內(nèi)容也不會(huì)發(fā)生改變。

ELMO的提出就是為了解決這種語境問題,動(dòng)態(tài)的去更新詞的word embedding。ELMO的本質(zhì)思想是:事先用語言模型在一個(gè)大的語料庫(kù)上學(xué)習(xí)好詞的word embedding,但此時(shí)的多義詞仍然無法區(qū)分,不過沒關(guān)系,我們接著用我們的訓(xùn)練數(shù)據(jù)(去除標(biāo)簽)來fine-tuning 預(yù)訓(xùn)練好的ELMO 模型。作者將這種稱為domain transfer。這樣利用我們訓(xùn)練數(shù)據(jù)的上下文信息就可以獲得詞在當(dāng)前語境下的word embedding。作者給出了ELMO 和Glove的對(duì)比

自然語言處理的ELMO使用

對(duì)于Glove訓(xùn)練出來的word embedding來說,多義詞play,根據(jù)他的embedding 找出的最接近的其他單詞大多數(shù)幾種在體育領(lǐng)域,這主要是因?yàn)橛?xùn)練數(shù)據(jù)中包含play的句子大多數(shù)來源于體育領(lǐng)域,之后在其他語境下,play的embedding依然是和體育相關(guān)的。而使用ELMO,根據(jù)上下文動(dòng)態(tài)調(diào)整后的embedding不僅能夠找出對(duì)應(yīng)的“表演”相同的句子,還能保證找出的句子中的play對(duì)應(yīng)的詞性也是相同的。接下來看看ELMO是怎么實(shí)現(xiàn)這樣的結(jié)果的。

2、模型結(jié)構(gòu)

ELMO 基于語言模型的,確切的來說是一個(gè) Bidirectional language models,也是一個(gè) Bidirectional LSTM結(jié)構(gòu)。我們要做的是給定一個(gè)含有N個(gè)tokens的序列

t1, t2, ... , tN

其前向表示為:

自然語言處理的ELMO使用

反向表示為:

自然語言處理的ELMO使用

從上面的聯(lián)合概率來看是一個(gè)典型的語言模型,前向利用上文來預(yù)測(cè)下文,后向利用下文來預(yù)測(cè)上文。假設(shè)輸入的token是自然語言處理的ELMO使用,在每一個(gè)位置 k ,每一層LSTM 上都輸出相應(yīng)的context-dependent的表征自然語言處理的ELMO使用

這里 j = 1 , 2 , ... , L ,L 表示LSTM的層數(shù)。頂層的LSTM 輸出,通過softmax層來預(yù)測(cè)下一個(gè)

對(duì)數(shù)似然函數(shù)表示如下:

自然語言處理的ELMO使用

模型的結(jié)構(gòu)圖如下:

自然語言處理的ELMO使用

ELMO 模型不同于之前的其他模型只用最后一層的輸出值來作為word embedding的值,而是用所有層的輸出值的線性組合來表示word embedding的值。

對(duì)于每個(gè)token,一個(gè)L層的 biLM要計(jì)算出 2L + 1 個(gè)表征:

自然語言處理的ELMO使用

在上面等于,表示的是token層的值。

在下游任務(wù)中會(huì)把 Rk壓縮成一個(gè)向量:

自然語言處理的ELMO使用

其中是softmax標(biāo)準(zhǔn)化權(quán)重,γtask?是縮放系數(shù),允許任務(wù)模型去縮放整個(gè)ELMO向量。

ELMO的使用主要有三步:

1)在大的語料庫(kù)上預(yù)訓(xùn)練 biLM 模型。模型由兩層bi-LSTM 組成,模型之間用residual connection 連接起來。而且作者認(rèn)為低層的bi-LSTM層能提取語料中的句法信息,高層的bi-LSTM能提取語料中的語義信息。

2)在我們的訓(xùn)練語料(去除標(biāo)簽),fine-tuning 預(yù)訓(xùn)練好的biLM 模型。這一步可以看作是biLM的domain transfer。

3)利用ELMO 產(chǎn)生的word embedding來作為任務(wù)的輸入,有時(shí)也可以即在輸入時(shí)加入,也在輸出時(shí)加入。

ELMO 在六項(xiàng)任務(wù)上取得了the state of the art ,包括問答,情感分析等任務(wù)。總的來說,ELMO提供了詞級(jí)別的動(dòng)態(tài)表示,能有效的捕捉語境信息,解決多義詞的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7536

    瀏覽量

    88641
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47666

    瀏覽量

    240288
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    python自然語言

    最近,python自然語言是越來越火了,那么什么是自然語言自然語言(Natural Language )廣納了眾多技術(shù),對(duì)自然或人類語言進(jìn)
    發(fā)表于 05-02 13:50

    【推薦體驗(yàn)】騰訊云自然語言處理

    `相信大家對(duì)NLP自然語言處理的技術(shù)都不陌生,它是計(jì)算機(jī)科學(xué)領(lǐng)域和AI領(lǐng)域中的一個(gè)分支,它與計(jì)算機(jī)和人類之間使用自然語言進(jìn)行交互密切相關(guān),而NLP的最終目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解語言
    發(fā)表于 10-09 15:28

    自然語言處理的分詞方法

    自然語言處理——75 自動(dòng)分詞基本算法
    發(fā)表于 03-19 11:46

    自然語言處理語言模型

    自然語言處理——53 語言模型(數(shù)據(jù)平滑)
    發(fā)表于 04-16 11:11

    自然語言處理的詞性標(biāo)注方法

    自然語言處理——78 詞性標(biāo)注方法
    發(fā)表于 04-21 11:38

    自然語言處理筆記

    自然語言處理筆記9-哈工大 關(guān)毅
    發(fā)表于 06-04 16:34

    自然語言處理——總結(jié)、習(xí)題

    自然語言處理——79 總結(jié)、習(xí)題
    發(fā)表于 06-19 11:22

    什么是自然語言處理

    會(huì)識(shí)別出我們正確說的話。 我們使用免費(fèi)服務(wù)將在線遇到的外語短語翻譯成英語, 有時(shí)它們可以為我們提供準(zhǔn)確的翻譯。 盡管自然語言處理取得了長(zhǎng)足的進(jìn)步,但仍有很大的改進(jìn)空間。[理...
    發(fā)表于 07-23 10:22

    什么是自然語言處理

    什么是自然語言處理自然語言處理任務(wù)有哪些?自然語言處理的方法是什么?
    發(fā)表于 09-08 06:51

    自然語言處理常用模型解析

    自然語言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語言處理開源項(xiàng)目/開發(fā)包有哪些?
    發(fā)表于 12-28 15:42 ?5933次閱讀
    <b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>常用模型解析

    什么是自然語言處理_自然語言處理常用方法舉例說明

    自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。自然語言處理
    發(fā)表于 12-28 16:56 ?1.8w次閱讀
    什么是<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>_<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>常用方法舉例說明

    自然語言處理怎么最快入門_自然語言處理知識(shí)了解

    自然語言處理就是實(shí)現(xiàn)人機(jī)間自然語言通信,實(shí)現(xiàn)自然語言理解和自然語言生成是十分困難的,造成困難的根本原因是
    發(fā)表于 12-28 17:10 ?5335次閱讀

    自然語言處理的概念和應(yīng)用 自然語言處理屬于人工智能嗎

      自然語言處理(Natural Language Processing)是一種人工智能技術(shù),它是研究自然語言與計(jì)算機(jī)之間的交互和通信的一門學(xué)科。自然語言
    發(fā)表于 08-23 17:31 ?1751次閱讀

    自然語言處理和人工智能的概念及發(fā)展史 自然語言處理和人工智能的區(qū)別

    自然語言處理(Natural Language Processing, NLP)的定義是通過電腦軟件程序?qū)崿F(xiàn)人們?nèi)粘?b class='flag-5'>語言的機(jī)器自動(dòng)處理。為了幫助計(jì)算機(jī)理解,掌握
    發(fā)表于 08-23 18:22 ?1121次閱讀

    自然語言處理包括哪些內(nèi)容

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)與人類語言之間的交互。NLP的目標(biāo)是讓計(jì)算機(jī)能夠理解、生成和處理
    的頭像 發(fā)表于 07-03 14:15 ?1181次閱讀
    现金百家乐技巧| 同乐城备用| 百家乐官网的看路技巧| 太阳城sun866| 足球竞猜规则| 百家乐打法分析| 娱乐博彩| 网络百家乐金海岸破解软件| 百家乐官网三多注码法| 利都百家乐国际娱乐场| 新澳门百家乐官网娱乐城| 上海二八杠分析仪| 金杯百家乐官网的玩法技巧和规则 | 粤港澳百家乐赌场娱乐网规则| 百家乐官网视频游戏客服| 爱赢百家乐的玩法技巧和规则| 百家乐官网网上赌局| 大发888游戏下载中心| 聚龍社百家乐官网的玩法技巧和规则| 立博博彩| 百家乐辅助器| 百家乐官网任你博娱乐网| 大发娱乐城官网| 百家乐单机版游戏下载| 百家乐官网分析网| 大发888真人赌博| 网上百家乐骗人的吗| 摩纳哥百家乐官网娱乐城| 大发888 有斗地主吗| 澳门百家乐官网技巧皇冠网| 大发888资讯网| 做生意门口禁忌| 百家乐官网有几种玩法| 太阳城公司| 克拉克百家乐试玩| 百家乐官网真钱送彩金| 本溪亿酷棋牌下载| 百家乐赌场网| 百家乐官网侧牌器| 和记娱乐城| 百家乐官网服务区|