近幾年,神經網絡因其強大的表征能力逐漸取代傳統的機器學習成為自然語言處理任務的基本模型。然而經典的神經網絡模型只能處理歐氏空間中的數據,自然語言處理領域中,篇章結構,句法甚至句子本身都以圖數據的形式存在。因此,圖神經網絡引起學界廣泛關注,并在自然語言處理的多個領域成功應用。該文對圖神經網絡在自然語言處理領域中的應用進行了系統性的綜述, 首先介紹了圖神經網絡的核心思想并梳理了三種經典方法: 圖循環網絡,圖卷積網絡和圖注意力網絡;然后在具體任務中,詳細描述了如何根據任務特性構建合適的圖結構以及如何合理運用圖結構表示模型。該文認為,相比專注于探索圖神經網絡的不同結構,探索如何以圖的方式建模不同任務中的關鍵信息,是圖神經網絡未來工作中更具普遍性和學術價值的一個研究方向。
自然語言處理中存在很多圖結構。如圖 1 所 示,從句法結構、語義關系圖、篇章關系結構,到實體和共指結構、關系結構和知識圖譜,都是一般的圖結 構。一個句子內部的字、詞相鄰關系也構成圖結構。形式上,圖由節點和邊組成。本文以三類圖結構為 例,觀察自然語言處理任務中相關的節點和邊,以便 更具體地了解這些任務所對應的圖。
第一類圖結構是基于句子的語言結構。已有研究表明,對關系提取、機器翻譯和其他自然語言處理 任務,句法[1]、語義[2]和篇章結構信息[3]非常有用。因此,一種在句子上定義圖結構的方法是把每個詞 當作節點,并把句法依存關系、語義角色和篇章關系 等節點之間的鏈接當作邊。我們可以在相鄰單詞之 間添加多種類型的邊,從而形成一種具有統一節點 類型但具有不同邊類型的圖。
第二類圖結構是基于文檔中的實體和共指關系 連接構建的,如圖 1(a)所示。對于機器閱讀的任 務,有研究表明,為了正確地回答問題,對參考文檔 中不同的句子進行推理可能是有必要的[4]。一種為 這種推理構建圖結構的方法是把文檔中提及的實體 作為節點,并把實體之間的共指鏈接作為邊。另外, 除了文本文檔中的實體,知識圖譜中的實體也可以 使用圖神經網絡進行編碼,如圖1(b)所示。
第三類圖結構可以是結構預測任務中的圖結構 本身。具體來說,如圖1(c)所示,多個基準結構化 預測模型給出的候選圖結構可以使用圖神經網絡表 示來進行重排序。這樣的候選圖結構可以由一個基 線系統的k 個最優的輸出結構組成。當將這些結 構整合在一起形成一個圖時,可以提取其中有用的 特征,以便從中進一步預測出正確的輸出[5]。
近年來,圖神經網絡已被廣泛運用到自然語言 處理的大多數任務當中。有一系列的工作利用圖神 經網絡對上述幾類任務中的圖結構進行編碼,從而 更充分地得到相關表示,能有效地解決相關問題。本綜述系統性地匯報相關工作,首先介紹圖神經網 絡的基本概念,然后根據不同任務,分別介紹圖網絡 在自然語言處理中的應用。與已有的圖神經網絡綜 述[6-7]相比,本文針對自然語言處理進行詳細闡述。
編輯:lyn
-
神經網絡
+關注
關注
42文章
4779瀏覽量
101171 -
自然語言處理
+關注
關注
1文章
619瀏覽量
13646
發布評論請先 登錄
相關推薦
評論