0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種LM任務(wù)形式:單向LM,雙向LM,序列到序列LM

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2021-01-03 09:25 ? 次閱讀

今天分享一個(gè)論文UniLM[1],核心點(diǎn)是掌握三種LM任務(wù)形式:單向LM,雙向LM,序列到序列LM;

1. 生成任務(wù)

NLP任務(wù)大致可以分為NLU和NLG兩種;Bert在NLU任務(wù)上效果很好,但是天生不適合處理生成任務(wù)。

原因在于Bert的預(yù)訓(xùn)練過程是使用的MLM,和生成任務(wù)的目標(biāo)并不一致。

生成任務(wù)目標(biāo)是每次蹦出來一個(gè)詞,只能看到當(dāng)前位置之前的詞匯。

而Bert采用的是雙向的語言模型,除了mask的單詞,兩個(gè)方向的詞匯都可以被看到。

所以對(duì)Bert的一個(gè)改進(jìn)思路就是讓它在具有NLU能力的時(shí)候,同時(shí)兼?zhèn)銷LG能力。

2. 三種LM任務(wù)

UniLM做的就是這樣一個(gè)事情。

具體的實(shí)現(xiàn)方式是設(shè)計(jì)了一系列的完形填空任務(wù),這些完形填空任務(wù)的不同之處在于對(duì)上下文的定義。

從左到右的LM:使用mask單詞的左側(cè)單詞來預(yù)測(cè)被遮掩的單詞

從右到左的LM:和上面第一個(gè)相比就是方向的變化,使用mask單詞的右側(cè)單詞來預(yù)測(cè)遮掩的單詞

雙向LM:就是當(dāng)前mask的左右詞匯都可以看到

sequence-to-sequence LM:這個(gè)就是UniLM能夠具有生成能力的關(guān)鍵。我們的輸入是source句子和target句子,mask單詞在target上,那么當(dāng)前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側(cè)的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務(wù)叫單向LM;

有個(gè)點(diǎn)需要注意,三個(gè)任務(wù)是一起優(yōu)化的,具體來講是這樣做的:

在訓(xùn)練的時(shí)候,1/3的時(shí)候使用雙向LM,1/3的時(shí)候使用序列到序列 LM,1/6的時(shí)候使用從左到右的LM,1/6的時(shí)間使用從右到做的LM。

我們是使用不同的Mask矩陣來對(duì)應(yīng)不同任務(wù)輸入數(shù)據(jù)形式。

文中使用的是這樣一張圖來展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他細(xì)枝末節(jié)

Gelu 激勵(lì)函數(shù)

24層TRM,最大長度512,1024Hidden Size,16Heads,340M參數(shù)

初始化使用Bert Large

15%被mask,其中80%真正替換mask,10%隨機(jī)替換,10%不動(dòng)。替換的時(shí)候,80% 的時(shí)候替換單個(gè)token,20%的時(shí)候替換bigram 或者 trigram

第四個(gè)步驟類似中文實(shí)體詞的mask,也算是一點(diǎn)改進(jìn)。

有個(gè)細(xì)節(jié)點(diǎn)需要注意的是,作者強(qiáng)調(diào),不同的segment embedding用來區(qū)分不同LM任務(wù)。

Bert的時(shí)候,區(qū)分上下句子,我們使用0和1,在這里,我們使用這個(gè)segment embedding用來區(qū)分任務(wù):

比如說,雙向?qū)?yīng)0和1;單向left-right對(duì)應(yīng)2;單向right-left對(duì)應(yīng)3;序列對(duì)應(yīng)4和5;

4. 總結(jié)

掌握以下幾個(gè)細(xì)節(jié)點(diǎn)就可以:

聯(lián)合訓(xùn)練三種任務(wù):單向LM,雙向LM,序列LM

使用不同的attention矩陣控制三種任務(wù)形式的參與

segment embedding可以區(qū)分不同的任務(wù)形式

mask的時(shí)候15% 的有被替換的概率,其中80% 被真正替換。在這80%真正替換的里面有80%單個(gè)token被替換,20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責(zé)任編輯:xj

原文標(biāo)題:如何讓BERT具有文本生成能力

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    279

    瀏覽量

    13295
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    481

    瀏覽量

    21935

原文標(biāo)題:如何讓BERT具有文本生成能力

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    LM324和LM358器件應(yīng)用設(shè)計(jì)指南

    電子發(fā)燒友網(wǎng)站提供《LM324和LM358器件應(yīng)用設(shè)計(jì)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 10:58 ?1次下載
    <b class='flag-5'>LM</b>324和<b class='flag-5'>LM</b>358器件應(yīng)用設(shè)計(jì)指南

    LM339能用LM324代替嗎

    LM339簡介 LM339是一款四路比較器集成電路,由美國國家半導(dǎo)體公司(National Semiconductor)生產(chǎn)。它具有以下特點(diǎn): 1.1. 四路比較器:LM339包含四個(gè)獨(dú)立的比較器
    的頭像 發(fā)表于 08-26 17:07 ?300次閱讀

    LM148、LM248和LM348運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM148、LM248和LM348運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-18 11:29 ?0次下載
    <b class='flag-5'>LM</b>148、<b class='flag-5'>LM</b>248和<b class='flag-5'>LM</b>348運(yùn)算放大器數(shù)據(jù)表

    LM118-N/LM218-N/LM318-N運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM118-N/LM218-N/LM318-N運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-13 10:09 ?0次下載
    <b class='flag-5'>LM</b>118-N/<b class='flag-5'>LM</b>218-N/<b class='flag-5'>LM</b>318-N運(yùn)算放大器數(shù)據(jù)表

    LM101A/LM201A/LM301A運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM101A/LM201A/LM301A運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-13 10:06 ?0次下載
    <b class='flag-5'>LM</b>101A/<b class='flag-5'>LM</b>201A/<b class='flag-5'>LM</b>301A運(yùn)算放大器數(shù)據(jù)表

    LM118、LM218和LM318精密、快速運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM118、LM218和LM318精密、快速運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-12 10:47 ?0次下載
    <b class='flag-5'>LM</b>118、<b class='flag-5'>LM</b>218和<b class='flag-5'>LM</b>318精密、快速運(yùn)算放大器數(shù)據(jù)表

    LM321LV、LM358LV、LM324LV運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM321LV、LM358LV、LM324LV運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-04 09:23 ?4次下載
    <b class='flag-5'>LM</b>321LV、<b class='flag-5'>LM</b>358LV、<b class='flag-5'>LM</b>324LV運(yùn)算放大器數(shù)據(jù)表

    LM339、LM239、LM139、LM2901 四路差分比較器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM339、LM239、LM139、LM2901 四路差分比較器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 05-07 16:20 ?0次下載

    1A降壓穩(wěn)壓器LM1575/LM2575/LM2575HV數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《1A降壓穩(wěn)壓器LM1575/LM2575/LM2575HV數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-28 13:50 ?1次下載
    1A降壓穩(wěn)壓器<b class='flag-5'>LM</b>1575/<b class='flag-5'>LM</b>2575/<b class='flag-5'>LM</b>2575HV數(shù)據(jù)表

    電壓軌簡單電源序列發(fā)生器LM3880-Q1 數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《電壓軌簡單電源序列發(fā)生器LM3880-Q1 數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-27 13:50 ?0次下載
    <b class='flag-5'>三</b>電壓軌簡單電源<b class='flag-5'>序列</b>發(fā)生器<b class='flag-5'>LM</b>3880-Q1 數(shù)據(jù)表

    電壓軌簡單電源序列發(fā)生器LM3880數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《電壓軌簡單電源序列發(fā)生器LM3880數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-26 13:45 ?0次下載
    <b class='flag-5'>三</b>電壓軌簡單電源<b class='flag-5'>序列</b>發(fā)生器<b class='flag-5'>LM</b>3880數(shù)據(jù)表

    lm358電壓上限和下限比較 LM358和LM358P區(qū)別是什么

    LM358的電壓上限為32V,而下限為0V。LM358與LM358P的主要區(qū)別在于它們的制造工藝和一些電氣特性。
    的頭像 發(fā)表于 01-28 17:16 ?8836次閱讀
    <b class='flag-5'>lm</b>358電壓上限和下限比較 <b class='flag-5'>LM</b>358和<b class='flag-5'>LM</b>358P區(qū)別是什么

    LM393與LM358的管腳功能一樣,想知道能否直接互換?

    LM393與LM358的管腳功能一樣,想知道能否直接互換? LM393和LM358是兩款常用的集成電路芯片,雖然它們的外觀相似,但在功能和應(yīng)用上存在一些差異。在電子設(shè)計(jì)和電路布局中,正
    的頭像 發(fā)表于 11-22 16:18 ?3910次閱讀

    【圖文】10 LM431應(yīng)用電路分析

    今天給大家分享的是: ? LM431 的 10 應(yīng)用電路 一、LM431 簡單介紹 LM431是一款 端穩(wěn)壓器 ,主要特點(diǎn)是 輸出電壓可
    的頭像 發(fā)表于 11-07 19:45 ?1637次閱讀
    【圖文】10 <b class='flag-5'>種</b> <b class='flag-5'>LM</b>431應(yīng)用電路分析

    lm317電源電路概述 lm317數(shù)字電源設(shè)計(jì)實(shí)例

    lm317電源電路概述 lm317數(shù)字電源設(shè)計(jì)實(shí)例 lm317可調(diào)電源設(shè)計(jì)要求解讀 LM317是一個(gè)常用的線性穩(wěn)壓電路,它可以作為電子電路中的常見電源電壓調(diào)整器。該器件采用
    的頭像 發(fā)表于 10-16 16:35 ?1825次閱讀