精品一二三区久久AAA片,日本一区二区三区精品国产,2022麻豆福利午夜久久

自然語言理解（NLU）和語言翻譯是一系列重要應(yīng)用的關(guān)鍵，包括大規(guī)模識別和刪除有害內(nèi)容，以及連接世界各地不同語言的人們。盡管近年來基于深度學(xué)習(xí)的方法加速了語言處理的進(jìn)展，但在處理大量標(biāo)記訓(xùn)練數(shù)據(jù)不易獲得的任務(wù)時，現(xiàn)有系統(tǒng)的處理水平仍然是有限的。

因此，F(xiàn)acebook 聯(lián)合 Deepmind Technologies、紐約大學(xué)（NYU）及華盛頓大學(xué)（UW）合作構(gòu)建新基準(zhǔn) SuperGLUE，并發(fā)布了相關(guān)內(nèi)容介紹該高難度測試基準(zhǔn)。

SuperGLUE 推出背景

最近，F(xiàn)acebook 人工智能在 NLP 方面取得了重大突破。Facebook 通過使用半監(jiān)督和自監(jiān)督學(xué)習(xí)技術(shù)，利用未標(biāo)記的數(shù)據(jù)來提高純監(jiān)督系統(tǒng)的性能。

在第四屆機器翻譯大會（WMT19）比賽中，F(xiàn)acebook 采用了一種新型的半監(jiān)督訓(xùn)練方法，并在多種語言翻譯任務(wù)中獲得了第一名。Facebook 還引入了一種新的自我監(jiān)督的預(yù)訓(xùn)練方法——RoBERTa。它在一些語言理解任務(wù)上超過了所有現(xiàn)有的 NLU 系統(tǒng)。在某些情況下，這些系統(tǒng)甚至優(yōu)于人類基線，包括英德翻譯和五個 NLU 基準(zhǔn)。

在整個自然語言處理領(lǐng)域，NLU 系統(tǒng)的發(fā)展速度如此之快，以至于它在許多現(xiàn)有的基準(zhǔn)上已經(jīng)達(dá)到了一個極限。為了繼續(xù)提高技術(shù)水平，F(xiàn)acebook 與 Deepmind Technologies、紐約大學(xué)及華盛頓大學(xué)合作開發(fā)了一套全新的基準(zhǔn)、排行榜和 PyTorch 工具包（https：//jiant.info/），F(xiàn)acebook 希望這些成果將進(jìn)一步推動自然語言處理領(lǐng)域的研究進(jìn)展。

簡而言之，這些新工具將幫助人類創(chuàng)建更強大的內(nèi)容理解系統(tǒng)，而且能夠翻譯數(shù)百種語言，理解諸如含糊不清、共同引用和常識性推理等復(fù)雜的問題，從而減少現(xiàn)有的這些系統(tǒng)對大量標(biāo)記訓(xùn)練數(shù)據(jù)的依賴性。

翻譯準(zhǔn)確性的突破

對于神經(jīng)機器翻譯（NMT）模型，有監(jiān)督式訓(xùn)練通常需要大量附有參考翻譯的句子。然而，大量高質(zhì)量的雙語數(shù)據(jù)并不是普遍可用的，這就要求研究人員使用沒有參考翻譯的單語數(shù)據(jù)。反向翻譯（Back translation，一種半監(jiān)督學(xué)習(xí)技術(shù)）允許 Facebook 在一定程度上克服這個問題。

Facebook 最近提交給 WMT 的報告是基于 Facebook 之前在大規(guī)模反向翻譯方面的工作，這也幫助 Facebook 在去年的同一比賽中贏得了第一名。

而今年，F(xiàn)acebook 引入了一種新的方法，通過生成多個候選譯文，并選擇最能平衡正向、反向、流暢性三種不同模型分?jǐn)?shù)的譯文，來進(jìn)一步改進(jìn) Facebook 的反向翻譯系統(tǒng)。

正向模型的分?jǐn)?shù)主要由候選翻譯在多大程度上捕捉了原句的意思來衡量；相反，反向模型的分?jǐn)?shù)是通過查看模型能從候選譯文中重建出的句子準(zhǔn)確性來評判；流暢性模型的分?jǐn)?shù)根據(jù)候選翻譯流暢性來衡量，最后系統(tǒng)通過觀察大量的單語數(shù)據(jù)以自我監(jiān)督的方式進(jìn)行訓(xùn)練；經(jīng)過對這三個分?jǐn)?shù)的平衡，系統(tǒng)就能夠產(chǎn)生顯著優(yōu)化后的翻譯結(jié)果。

經(jīng)過幾年的努力，F(xiàn)acebook 將英-德語翻譯任務(wù)的性能提高了 4.5 BLEU（衡量生成的翻譯和專業(yè)參考之間重疊程度的指標(biāo)），這是一個很大的改進(jìn)。根據(jù)人工評估，F(xiàn)acebook 的模型在英-德、德-英、英-俄，和俄-英四個翻譯任務(wù)中排名第一。根據(jù) WMT 賽制的評判，F(xiàn)acebook 的英-德語翻譯甚至比人工翻譯更佳。

圖 1 Facebook 引入的一種新方法

上面的圖片展示了這種技術(shù)是如何工作的：首先，一個正向模型將一個句子翻譯成英語，例如從德語翻譯成英語，就會生成一組英語翻譯或假設(shè)。然后，一個反向模型將這些英語假設(shè)翻譯回德語，使系統(tǒng)能夠評估每個英語翻譯與原始德語句子的匹配程度。最后，一個語言模型來判斷英語翻譯的流暢程度。

Facebook 還將訓(xùn)練擴展到了更大的數(shù)據(jù)集，包括大約 100 億個單詞用于英語到德語翻譯的詞匯。與去年相比，F(xiàn)acebook 使用了兩倍多的單語數(shù)據(jù)進(jìn)行半監(jiān)督訓(xùn)練，進(jìn)一步提高了翻譯的準(zhǔn)確性。更多詳情，可以參考 Facebook 人工智能在 2019 年 WMT 國際機器翻譯大賽中的表現(xiàn)（https：//ai.facebook.com/blog/facebook-leads-wmt-translation-competition/）。

自監(jiān)督預(yù)訓(xùn)練方法的改進(jìn)

Facebook 最近對自然語言處理（NLP）的最大突破——BERT，也進(jìn)行了優(yōu)化和改進(jìn)。Google 在 2018 年發(fā)布了 BERT。它是革命性的，因為它展示了自監(jiān)督訓(xùn)練技術(shù)的潛力，它具有與傳統(tǒng)的標(biāo)簽密集型監(jiān)督方法的性能相媲美甚至超越它的能力。例如，F(xiàn)acebook 利用 BERT 和相關(guān)方法推動對話型人工智能領(lǐng)域的前沿研究，改進(jìn)內(nèi)容理解系統(tǒng)，提高低資源和無監(jiān)督的翻譯質(zhì)量。

因為 Google 開源了 BERT，F(xiàn)acebook 才能夠進(jìn)行一項復(fù)制研究，并確定進(jìn)一步提高其有效性的設(shè)計變更。Facebook 引入了穩(wěn)健優(yōu)化的 BERT 預(yù)訓(xùn)練方法，即 RoBERTa，并取得了新的最先進(jìn)進(jìn)展。

RoBERTa 修改了 BERT 中的關(guān)鍵超參數(shù)，包括刪除 BERT 的下一個句子的預(yù)訓(xùn)練目標(biāo)，并使用更大的批量和學(xué)習(xí)率進(jìn)行訓(xùn)練。與 BERT 相比，RoBERTa 的數(shù)據(jù)總量要多 10 倍以上，因此訓(xùn)練時間也要長得多。這種方法在廣泛使用的 NLP 基準(zhǔn)測試、通用語言理解評估（GLUE）和閱讀理解考試（RACE）上產(chǎn)生了最先進(jìn)的結(jié)果。

圖 2 圖表展示了 RoBERTa 在不同任務(wù)中的結(jié)果

憑借平均得分 88.5 分，RoBERTa 贏得了 GLUE 排行榜的榜首位置，與之前第一名——平均得分為 88.4 分的 XLNet-Large 表現(xiàn)不相上下。RoBERTa 還在一些語言理解基準(zhǔn)測試水平上實現(xiàn)了提高，包括 MNLI、QNLI、RTE、STS-B 和 RACE 任務(wù)。

這一部分就是 Facebook 不斷致力于提高不太依賴于數(shù)據(jù)標(biāo)記的自監(jiān)督系統(tǒng)的性能和潛力的內(nèi)容。有關(guān) RoBERTa 的更多詳細(xì)信息，請參考‘RoBERTa：預(yù)訓(xùn)練自監(jiān)督 NLP 系統(tǒng)的優(yōu)化方法（https：//ai.facebook.com/blog/roberta-an-optimized-method-for-pretraining-self-supervised-nlp-systems/）’。

NLP 研究的下一個前沿

作為衡量研究進(jìn)展的行業(yè)標(biāo)準(zhǔn)，GLUE 旨在覆蓋大量的 NLP 任務(wù)，因此只有構(gòu)建足夠通用的工具來幫助解決大多數(shù)新的語言理解問題，才能得到良好的表現(xiàn)。

在發(fā)布后的一年內(nèi)，幾個 NLP 模型（包括 RoBERTa）已經(jīng)在 GLUE 基準(zhǔn)測試中超過了人類。目前的模型已經(jīng)提出了一個令人驚訝的有效方法，它將大型文本數(shù)據(jù)集上的語言模型預(yù)訓(xùn)練與簡單的多任務(wù)和轉(zhuǎn)移學(xué)習(xí)技術(shù)進(jìn)行了結(jié)合。

這種快速的進(jìn)步是大型人工智能社區(qū)內(nèi)協(xié)作的一個功能。上面描述的 NLP 競賽、基準(zhǔn)測試和代碼發(fā)布使模型復(fù)制，改進(jìn)和最先進(jìn)結(jié)果的更快進(jìn)步成為可能。隨著 GPT 和 BERT 的引入，GLUE 的模型性能急劇提升，現(xiàn)在最先進(jìn)的模型已經(jīng)超越了人類的能力，如圖 3 所示：

圖 3 最先進(jìn)的自然語言處理模型能力已經(jīng)超越人類

盡管目前的模型可以在特定的 GLUE 任務(wù)上超越人類水平的性能，但它們還不能完美地解決人類解決的一些任務(wù)。為了給 NLP 研究設(shè)定一個新的更高的標(biāo)準(zhǔn)，facebook 人工智能團(tuán)隊與紐約大學(xué)、deepmind 以及華盛頓大學(xué)合作構(gòu)建了 SuperGLUE，這是一個具有全面人類基線的更高難度基準(zhǔn)。Facebook 正在推出 SuperGlue，讓自然語言理解領(lǐng)域的研究人員能夠繼續(xù)推進(jìn)最先進(jìn)的技術(shù)。

SuperGLUE 基準(zhǔn)測試

最初的基準(zhǔn)和新的基準(zhǔn)都是由紐約大學(xué)發(fā)起，與相同的合作伙伴合作創(chuàng)建。SuperGLUE 緊跟 GLUE 的腳步，GLUE 提供了單一的數(shù)字度量，用于總結(jié)不同 NLP 任務(wù)集的進(jìn)度。除了新的基準(zhǔn)之外，F(xiàn)acebook 還發(fā)布了一個用于引導(dǎo)研究的排行榜和 pytorch 工具包。

SuperGlue 包含了新的方法來測試一系列困難的 NLP 任務(wù)的創(chuàng)造性方法，這些任務(wù)主要關(guān)注機器學(xué)習(xí)一些核心領(lǐng)域的創(chuàng)新，包括樣本有效性、轉(zhuǎn)移、多任務(wù)和自監(jiān)督學(xué)習(xí)。為了向研究人員提出挑戰(zhàn)，F(xiàn)acebook 選擇了格式多樣、問題更為微妙、尚未用最先進(jìn)方法解決但容易被人們解決的任務(wù)。為了檢查這些任務(wù)，F(xiàn)acebook 為許多候選任務(wù)運行基于 BERT 的基線，并為人工基線收集數(shù)據(jù)。

新的基準(zhǔn)測試包括八個不同且具有挑戰(zhàn)性的任務(wù)，其中包括選擇合理的替代方案（COPA），一個因果推理任務(wù)。在這個任務(wù)中，系統(tǒng)被賦予一個前提語句，并且必須從兩個可能的選擇中確定這個前提語句的因果。值得注意的是，人類在 COPA 上獲得了 100% 的準(zhǔn)確率，而 BERT 只獲得了 74%，這表明 BERT 還有很大的進(jìn)步空間。

其他獨特的前沿組件還包括用于測量這些模型中偏差的診斷工具。例如：winogender，它是為了測試在自動指代消解系統(tǒng)（automated co-reference resolution systems）中是否存在性別偏見而設(shè)計的。SuperGlue 還包括一個名為‘BoolQ’的問答（QA）任務(wù)，其中每個示例都由一個段落和一個關(guān)于該段落的是’或‘否’問題組成；它是自然問題基準(zhǔn)測試中的一個很好的工具。

圖 4 該示例表示 SuperGlue 中八個任務(wù)中的 1 個。粗體文本表示每個任務(wù)示例格式的一部分；斜體文本是模型輸入的一部分；帶下劃線的文本在輸入中特別標(biāo)記；等寬字體中的文本表示預(yù)期的模型輸出（更多示例請閱讀原文）

與 GLUE 類似，新的基準(zhǔn)測試還包括一個圍繞自然語言理解任務(wù)構(gòu)建的公共排行榜，它利用現(xiàn)有數(shù)據(jù)，并附帶一個單數(shù)字性能指標(biāo)和一個分析工具包。

Facebook 最近針對新的基準(zhǔn)測試了 RoBERTa，RoBERTa 在多語言閱讀理解（Multientence Reading Comprehension，MultiRC）任務(wù)中的表現(xiàn)超過了所有現(xiàn)有的 NLU 系統(tǒng)，甚至超過了人類在該任務(wù)上的基線。盡管如此，在許多 SuperGLUE 任務(wù)中，RoBERTa 與人類基線之間仍然存在很大差距，這說明了當(dāng)今最先進(jìn)的 NLU 系統(tǒng)的一些局限性。

圖 5 RoBERTa 在多語言閱讀理解任務(wù)中表現(xiàn)與其它方法的對比

下一步計劃

為了進(jìn)一步挑戰(zhàn)人工智能系統(tǒng)能為人類提供的幫助，F(xiàn)acebook 還引入了第一個長格式的問答數(shù)據(jù)集和基準(zhǔn)測試，它要求機器提供長而復(fù)雜的答案——這是現(xiàn)有算法以前從未遇到過的挑戰(zhàn)。

目前的問答系統(tǒng)主要集中在一些瑣碎的問題上，比如水母是否有大腦。這項新的挑戰(zhàn)更進(jìn)一步，要求機器對開放性問題進(jìn)行深入的解答，例如‘沒有大腦，水母如何工作？’現(xiàn)有的算法與人類的表現(xiàn)相去甚遠(yuǎn)，這一新的挑戰(zhàn)將促使人工智能合成來自不同來源的信息，為開放式問題提供復(fù)雜的答案。

近期，F(xiàn)acebook 還公布了來自 35 個國家的 115 份獲獎提案中的 11 份，并宣布成立人工智能語言研究聯(lián)盟（AI Language Research Consortium），這是一個由合作伙伴組成的社區(qū)，F(xiàn)acebook 表示將‘共同努力，推進(jìn) NLP’。

除了與 Facebook 的研究人員就多年項目和出版物進(jìn)行合作外，人工智能語言研究聯(lián)盟的成員還有機會獲得研究經(jīng)費，參加年度研究講習(xí)班，參加重要的 NLP 會議。Facebook 表示：‘這些 NLP 和機器翻譯的研究獎項是我們長期目標(biāo)的延續(xù)，我們希望這個聯(lián)盟，以及這些 NLP 和機器翻譯的研究獎項，會有助于加速 NLP 社區(qū)的研究。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Facebook

Facebook

+關(guān)注

關(guān)注
3

文章
1429

瀏覽量
54479
人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46061

瀏覽量
235039

圖像識別技術(shù)包括自然語言處理嗎

圖像識別技術(shù)與自然語言處理是人工智能領(lǐng)域的兩個重要分支，它們在很多方面有著密切的聯(lián)系，但也存在一些區(qū)別。一、圖像識別技術(shù)與自然語言處理的關(guān)系 1.1 圖像識別技術(shù)的定義圖像識別技術(shù)

發(fā)表于 07-16 10:54 ?394次閱讀

Transformer架構(gòu)在自然語言處理中的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，自然語言處理（NLP）領(lǐng)域取得了顯著的進(jìn)步。其中，Transformer架構(gòu)的提出，為NLP領(lǐng)域帶來了革命性的變革。本文將深入探討Transformer架構(gòu)的核心思想、組成部分以及在

發(fā)表于 07-09 11:42 ?530次閱讀

用于自然語言處理的神經(jīng)網(wǎng)絡(luò)有哪些

自然語言處理（Natural Language Processing, NLP）是人工智能領(lǐng)域的一個重要分支，旨在讓計算機能夠理解和處理人類語言。隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展，神經(jīng)網(wǎng)絡(luò)模

發(fā)表于 07-03 16:17 ?340次閱讀

自然語言處理技術(shù)有哪些

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領(lǐng)域的一個分支，它致力于使計算機能夠理解、解釋和生成人類語言。

發(fā)表于 07-03 14:30 ?601次閱讀

自然語言處理模式的優(yōu)點

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領(lǐng)域的一個重要分支，它致力于使計算機能夠理解、生成和處理人類語言。隨著技術(shù)的發(fā)展，

發(fā)表于 07-03 14:24 ?408次閱讀

自然語言處理技術(shù)的核心是什么

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領(lǐng)域的一個重要分支，其核心目標(biāo)是使計算機能夠理解、生成和處理人類語言。NLP技術(shù)的發(fā)展已經(jīng)

發(fā)表于 07-03 14:20 ?340次閱讀

自然語言處理是什么技術(shù)的一種應(yīng)用

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能和語言學(xué)領(lǐng)域的一個分支，它涉及到使用計算機技術(shù)來處理、分析和生成自然語言文本。

發(fā)表于 07-03 14:18 ?310次閱讀

自然語言處理包括哪些內(nèi)容

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領(lǐng)域的一個重要分支，它涉及到計算機與人類語言之間的交互。NLP的目標(biāo)是讓計算機能夠理解、生成

發(fā)表于 07-03 14:15 ?517次閱讀

自然語言列舉法描述法各自的特點

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領(lǐng)域的一個重要分支，它涉及到計算機與人類語言之間的交互。自然語言處理技術(shù)使得計算機能夠

發(fā)表于 07-03 14:13 ?679次閱讀

自然語言處理屬于人工智能的哪個領(lǐng)域

之間的交互，旨在使計算機能夠理解、生成和處理自然語言。 自然語言處理：人工智能的皇冠上的明珠引言 人工智能作為一門跨學(xué)科的研究領(lǐng)域，涵蓋了

發(fā)表于 07-03 14:09 ?695次閱讀

什么是自然語言處理 (NLP)

自然語言處理（Natural Language Processing, NLP）是人工智能領(lǐng)域中的一個重要分支，它專注于構(gòu)建能夠理解和生成人類語言的計算機系統(tǒng)。NLP的目標(biāo)是使計算機能

發(fā)表于 07-02 18:16 ?598次閱讀

自然語言處理技術(shù)的原理的應(yīng)用

自然語言處理（Natural Language Processing, NLP）作為人工智能（AI）領(lǐng)域的一個重要分支，旨在使計算機能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)

發(fā)表于 07-02 12:50 ?242次閱讀

神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用

自然語言處理（NLP）是人工智能領(lǐng)域中的一個重要分支，它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術(shù)的飛速發(fā)展，神經(jīng)網(wǎng)絡(luò)

發(fā)表于 07-01 14:09 ?287次閱讀

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

化能力和適應(yīng)性。在自然語言處理任務(wù)中，大語言模型展現(xiàn)出卓越的語言理解和生成能力。此外，大語言模型還能在

發(fā)表于 05-04 23:55

量子計算機未來希望

自己從事語音識別產(chǎn)品設(shè)計開發(fā)，而量子技術(shù)和量子計算機必將在自然語言處理方面實現(xiàn)重大突破，想通過此書學(xué)習(xí)量子計算技術(shù)，儲備知識，謝謝！

發(fā)表于 02-01 12:51

搜索歷史

Facebook人工智能在自然語言理解方面取得重大突破

評論