那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹一種新穎的三元組對比學習訓練框架

深度學習自然語言處理 ? 來源:浙大KG ? 作者:葉宏彬 ? 2021-06-23 15:56 ? 次閱讀

摘要

在自然語言處理和知識圖譜領域的信息提取中,三元組抽取是必不可少的任務。在本文中,我們將重新審視用于序列生成的端到端三元組抽取任務。由于生成三元組抽取可能難以捕獲長期依賴關系并生成不忠實的三元組,因此我們引入了一種新的模型,即使用生成式Transformer的對比學習三元組抽取框架。

具體來說,我們介紹了一個共享的Transformer模塊,用于基于編碼器-解碼器的生成。為了產生忠實的結果,我們提出了一種新穎的三元組對比學習訓練框架。此外,我們引入了兩種機制來進一步改善模型的性能(即,分批動態注意掩碼和三元組校準)。在三個數據集(NYT,WebNLG和MIE)上的實驗結果表明,我們的方法比基線具有更好的性能。我們的代碼和數據集將在論文出版后發布。

論文動機

編碼器-解碼器模型是功能強大的工具,已在許多NLP任務中獲得成功,但是現有方法仍然存在兩個關鍵問題。首先,由于遞歸神經網絡(RNN)的固有缺陷,它們無法捕獲長期依賴關系,從而導致重要信息的丟失,否則將在句子中反映出來,從而導致模型無法應用更長的文本。第二,缺乏工作致力于生成忠實的三元組,序列到序列的體系結構會產生不忠實的序列,從而產生意義上的矛盾。例如,給定句子“美國總統特朗普在紐約市皇后區長大,并居住在那里直到13歲”,該模型可以生成事實“(特朗普出生于皇后區)”。盡管從邏輯上講是正確的,但我們無法從給定的句子中找到直接的證據來支持它。

為了解決這些問題,我們引入了帶有生成變壓器(CGT)的對比學習三元組提取框架,該框架是一個共享的Transformer模塊,支持編碼器-解碼器的生成式三元組對比學習多任務學習。首先,我們使用分隔符和部分因果掩碼機制將輸入序列與目標序列連接起來,以區分編碼器-解碼器表示形式。除了預先訓練的模型之外,我們的模型不需要任何其他參數。然后,我們介紹了一種新穎的三元組對比學習對象,該對象利用真實的三元組作為正實例,并利用隨機令牌采樣將損壞的三元組構造為負實例。為了共同優化三元組生成對象和對比學習對象,我們引入了分批動態注意掩碼機制,該機制允許我們動態選擇不同的對象并共同優化任務。最后,我們介紹了一種新穎的三元組校準算法,以在推理階段濾除虛假三元組。

這項工作的貢獻如下:

我們將三元組提取作為序列生成任務進行了重新介紹,并引入了一種新穎的CGT模型??紤]到增加的提取功能,CGT除了在預訓練語言模型中發現的參數外,不需要其他參數。

我們引入了兩種機制來進一步提高模型性能(即,批處理動態注意掩碼和三元組校準)。第一個可以聯合優化不同的對象,第二個可以確保忠實的推理。

我們在三個基準數據集上評估了CGT。 我們的模型優于其他強大的基準模型。我們還證明,在捕獲長期依存關系方面,CGT比現有的三元組抽取方法更好,因此,在使用長句子場景下依然可以獲得更好的性能。

模型框架

ffb2014e-d3f6-11eb-9e57-12bb97331649.png

這里我們展示了CGT生成式Transformer的總體架構。右上部分表示Transformer生成模塊,右下部分表示三元組對比學習模塊。這兩個部分訓練時共同優化。生成模塊依靠部分因果掩碼機制建模成序列生成任務,如右圖中的示例所示,對于三元組序列生成,其中右上部分設置為-∞以阻止從源段到目標段的關注;左側部分設置為全0,表示令牌能夠參與第一段。利用交叉熵損失生成來優化三元組生成過程,獲得生成損失。對比學習模塊將輸入文本與正確的三元組實例或者偽造的三元組進行隨機拼接,依靠部分因果掩碼機制建模成文本分類任務,其中mask矩陣的元素全為0,利用經過MLP多層感知機層的特殊token[CLS]表示來計算分類打分函數,鑒別是否為正確實例,從而增強模型對關鍵token的感知能力。我們利用交叉熵優化對比損失。生成損失與對比學習損失通過一個超參數權衡構成了我們最終的總體損失。我們的解碼推理采用的是波束搜索和啟發式約束。

實驗結果

我們對三個基準數據集進行了實驗:紐約時報(NYT),WebNLG和MIE。MIE是醫學領域的大規模中文對話信息提取數據集。圖2中中顯示了這三個數據集的部分實驗統計信息。

ffcac79c-d3f6-11eb-9e57-12bb97331649.png

ffd4edda-d3f6-11eb-9e57-12bb97331649.png

責任編輯:lq6

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3669

    瀏覽量

    135258
  • 自然語言處理

    關注

    1

    文章

    619

    瀏覽量

    13646

原文標題:AAAI2021-基于對比學習的三元組生成式抽取方法

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于梯度下降算法的三元鋰電池循環壽命預測

    摘要:隨著電動汽車產銷量的持續攀升,對于動力電池循環壽命性能的評估及預測已成為行業內重點關注的問題之。對某款三元鋰電池進行了25℃及45℃下的長周期循環壽命試驗,將試驗得到的循環壽命數據進行了
    的頭像 發表于 01-16 10:19 ?176次閱讀
    基于梯度下降算法的<b class='flag-5'>三元</b>鋰電池循環壽命預測

    三元鋰電生命循環究竟是多長?朗凱威鋰電電池定制 三元鋰電池DIY

    壽命長,節能環保無污染,維護成本低,充放電完全,重量輕等等優勢,在些宣傳的資料里,有人認為三元鋰電池壽命長,真的是這樣嗎?它的生命循環周期究竟多少次呢?讓我們來揭開真相。
    的頭像 發表于 12-19 15:59 ?211次閱讀
    <b class='flag-5'>三元</b>鋰電生命循環究竟是多長?朗凱威鋰電電池定制 <b class='flag-5'>三元</b>鋰電池<b class='flag-5'>組</b>DIY

    朗凱威三元鋰電池 6020:高性能能源解決方案

    三元鋰電池 6020 (133-2632-1310)作為一種高性能的能源解決方案,具有高能量密度、長壽命、快速充電、安全可靠、環保節能等優點,廣泛應用于電動自行車、電動摩托車、電動汽車等領域。在
    的頭像 發表于 11-21 17:23 ?378次閱讀
    朗凱威<b class='flag-5'>三元</b>鋰電池<b class='flag-5'>組</b> 6020:高性能能源解決方案

    三元鋰電池行業發展趨勢

    三元鋰電池,即三元正極材料鋰電池,因其正極材料由鎳、鈷、錳(或鋁)三種元素組成而得名。這種電池因其高能量密度、長循環壽命和良好的安全性能而受到市場的廣泛關注。 三元鋰電池行業發展趨勢
    的頭像 發表于 10-31 10:28 ?688次閱讀

    三元鋰電池的優勢和劣勢

    三元鋰電池,指的是以鎳(Ni)、鈷(Co)和錳(Mn)三種元素作為正極材料的鋰電池。這種電池因其高能量密度、長循環壽命和較好的安全性能而被廣泛應用于電動汽車、移動設備和儲能系統等領域。 三元鋰電池
    的頭像 發表于 10-31 09:49 ?1471次閱讀

    三元鋰電池在電動車的應用

    動力電池的主流選擇。 三元鋰電池概述 三元鋰電池,全稱為三元正極材料鋰離子電池,其正極材料主要由鎳(Ni)、鈷(Co)和錳(Mn)三種元素組成,因此得名。這種電池因其高能量密度、良好的
    的頭像 發表于 10-31 09:47 ?679次閱讀

    三元鋰電池放電特性及應用

    隨著科技的進步和環保意識的增強,鋰電池因其高能量密度、長壽命和環保特性而成為新能源領域的明星。三元鋰電池作為鋰電池的一種,因其獨特的優勢在眾多領域得到廣泛應用。 三元鋰電池放電特性 1. 高能量密度
    的頭像 發表于 10-31 09:46 ?758次閱讀

    三元鋰電池與磷酸鐵鋰對比

    隨著電動汽車和儲能市場的快速發展,電池技術成為了能源轉型的關鍵。三元鋰電池(NMC/NCA)和磷酸鐵鋰電池(LFP)是兩主要的鋰離子電池技術,它們在性能、成本、安全性和環境影響等方面各有千秋
    的頭像 發表于 10-31 09:40 ?875次閱讀

    三元鋰電池使用壽命分析

    隨著全球能源結構的轉型和新能源汽車的快速發展,電池技術成為推動這變革的關鍵因素。三元鋰電池因其高能量密度、良好的循環穩定性和較低的成本而受到青睞。 、三元鋰電池的基本特性
    的頭像 發表于 10-31 09:39 ?746次閱讀

    三元鋰電池的組成與功能

    在當前新能源汽車的發展浪潮中,三元鋰電池作為一種先進的儲能技術,已經成為推動電動汽車行業進步的關鍵因素之。這種電池之所以被稱為“三元”,是因為它結合了
    的頭像 發表于 09-17 16:07 ?1576次閱讀

    鴻蒙原生應用服務開發-倉頡基礎數據類型元組類型

    ,例如,(Int64, Float64) 表示個二元組類型,(Int64, Float64, String) 表示三元組類型。
    發表于 09-12 11:02

    18650三元鋰電池的優點

    18650三元鋰電池的優點
    的頭像 發表于 08-30 20:07 ?1291次閱讀
    18650<b class='flag-5'>三元</b>鋰電池的優點

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度學習
    的頭像 發表于 07-02 14:04 ?1078次閱讀

    軟包三元鋰電池能和硬包三元鋰電池能混合用嗎

    在電池使用和系統中,將軟包三元鋰電池與硬包三元鋰電池混合使用是個復雜的問題,涉及到電池的化學成分、物理結構、電氣特性以及系統設計等多個方面的考量。
    的頭像 發表于 05-07 10:48 ?1165次閱讀

    刀片電池和三元鋰電池對比

    刀片電池和三元鋰電池是當前電動車動力電池領域的兩大主流技術。它們各自具有獨特的優勢和局限性,適用于不同的應用場景和需求。
    的頭像 發表于 05-06 17:09 ?2662次閱讀
    百家乐游戏奥秘| 金域百家乐的玩法技巧和规则 | 路单百家乐的玩法技巧和规则| 皇冠正网| 百家乐官网多少钱| 都坊百家乐的玩法技巧和规则| 海立方娱乐城| 广发百家乐官网的玩法技巧和规则| 大发888真钱赌场娱乐网规则| 百家乐官网网络游戏平台| 百家乐巴厘岛娱乐城| 至棒娱乐备用| 风水24山图| bet365游戏| 菲彩百家乐官网的玩法技巧和规则| 威尼斯人娱乐城图片| 澳门百家乐官网玩法心得技巧| 娱乐城百家乐送白菜| 兴山县| 下载百家乐棋牌大厅| 顺昌县| 百家乐网站是多少| 打百家乐官网如何赢分| 百家乐最佳注码法| 百家乐官网娱乐人物| 百家乐必胜密| 宾利百家乐官网现金网| 电脑赌百家乐可靠吗| 真人百家乐官网网站接口| 广州百家乐赌场娱乐网规则| 广东百家乐官网扫描分析仪| 丽星百家乐的玩法技巧和规则 | 罗盘24山珠宝火坑| 浩博真人娱乐| 百家乐投注方法新版| 百家乐官网波浪法则| 百家乐心术| 百家乐官网如何洗吗| 大发888大发888官方| 爱婴百家乐官网的玩法技巧和规则 | 太阳神网上娱乐|