來(lái)自加利福尼亞州歐文分校的艾倫人工智能研究所和研究人員發(fā)布了AllenNLP Interpret,該工具包用于解釋自然語(yǔ)言處理(NLP)模型的結(jié)果。可擴(kuò)展的工具包包括用于解釋和可視化組件的幾種內(nèi)置方法,以及使用AllenNLP Interpret解釋包含BERT和RoBERTa的最新NLP模型的結(jié)果的示例。
在arXiv上發(fā)表的一篇論文中,研究團(tuán)隊(duì)更詳細(xì)地描述了該工具包。AllenNLP Interpret使用兩種基于梯度的解釋方法:顯著性圖,確定輸入句子中的每個(gè)單詞或“標(biāo)記”對(duì)模型的預(yù)測(cè)有多大作用;以及對(duì)抗攻擊,嘗試刪除或更改輸入中的單詞,同時(shí)仍保持來(lái)自模型的相同預(yù)測(cè)。這些技術(shù)可用于各種NLP任務(wù)和模型架構(gòu)。這些實(shí)現(xiàn)使用一組通用的API和可視化組件,為將來(lái)開(kāi)發(fā)其他技術(shù)和模型支持提供了框架。
隨著公司越來(lái)越多地使用AI來(lái)自動(dòng)提供問(wèn)題的答案,用戶想知道為什么 AI會(huì)給出給定的答案。例如,在檢測(cè)到信用卡交易欺詐的情況下,該交易特別暗示欺詐嗎?
對(duì)模型如何產(chǎn)生答案的解釋對(duì)于模型開(kāi)發(fā)人員了解面對(duì)新數(shù)據(jù)時(shí)系統(tǒng)將如何泛化的能力也很重要。AllenNLP Interpret研究人員Sameer Singh經(jīng)常引用該模型來(lái)區(qū)分狼和狗,但實(shí)際上只是學(xué)會(huì)了檢測(cè)雪。
對(duì)于某些機(jī)器學(xué)習(xí)算法,解釋很簡(jiǎn)單:例如,決策樹(shù)只是一系列if / then規(guī)則。但是,深度學(xué)習(xí)模型的輸出可能更難以解釋。
辛格的先前工作包括LIME,它使用線性逼近來(lái)解釋更復(fù)雜模型的預(yù)測(cè)。AllenNLP Interpret使用基于梯度的方法,該方法可測(cè)量輸入要素對(duì)輸出的影響。由于計(jì)算此梯度是深度學(xué)習(xí)培訓(xùn)的關(guān)鍵組成部分,因此這些方法可以應(yīng)用于任何深度學(xué)習(xí)模型。
盡管這些技術(shù)是通用的,但AllenNLP Interpret旨在用于NLP。NLP系統(tǒng)的輸入是文本字符串,通常是句子或整個(gè)文檔,然后將文本解析為其組成詞或標(biāo)記。AllenNLP Interpret包括顯著性圖,顯示每個(gè)標(biāo)記對(duì)模型預(yù)測(cè)的貢獻(xiàn);一個(gè)用例可能是解釋句子中的哪些單詞導(dǎo)致其情感被分為正面或負(fù)面。
該工具包還包括兩個(gè)對(duì)抗方法,這些方法顯示了更改輸入中的標(biāo)記如何影響輸出。第一,HotFlip,用其他單詞替換斜率最高的輸入單詞,直到模型輸出更改。另一種攻擊是輸入縮減,它會(huì)反復(fù)刪除坡度最小的單詞,而不會(huì)更改輸出。這導(dǎo)致輸入文本“通常是無(wú)意義的,但會(huì)引起高置信度預(yù)測(cè)”。
-
人工智能
+關(guān)注
關(guān)注
1791文章
46691瀏覽量
237179 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
603瀏覽量
13487
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論