0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LeCun新作:全面綜述下一代「增強(qiáng)語(yǔ)言模型」

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:新智元 ? 2023-03-03 11:03 ? 次閱讀

【導(dǎo)讀】語(yǔ)言模型該怎么增強(qiáng)?

ChatGPT算是點(diǎn)燃了語(yǔ)言模型的一把火,NLP的從業(yè)者都在反思與總結(jié)未來(lái)的研究方向。

70884f64-b91e-11ed-bfe3-dac502259ad0.png

最近圖靈獎(jiǎng)得主Yann LeCun參與撰寫(xiě)了一篇關(guān)于「增強(qiáng)語(yǔ)言模型」的綜述,回顧了語(yǔ)言模型與推理技能和使用工具的能力相結(jié)合的工作,并得出結(jié)論,這個(gè)新的研究方向有可能解決傳統(tǒng)語(yǔ)言模型的局限性,如可解釋性、一致性和可擴(kuò)展性問(wèn)題。

709c89c0-b91e-11ed-bfe3-dac502259ad0.png

論文鏈接:https://arxiv.org/abs/2302.07842

增強(qiáng)語(yǔ)言模型中,推理意為將復(fù)雜的任務(wù)分解為更簡(jiǎn)單的子任務(wù),工具包括調(diào)用外部模塊(如代碼解釋器、計(jì)算器等),LM可以通過(guò)啟發(fā)式方法單獨(dú)使用或組合利用這些增強(qiáng)措施,或者通過(guò)演示學(xué)習(xí)實(shí)現(xiàn)。

在遵循標(biāo)準(zhǔn)的missing token預(yù)測(cè)目標(biāo)的同時(shí),增強(qiáng)的LM可以使用各種可能是非參數(shù)化的外部模塊來(lái)擴(kuò)展上下文處理能力,不局限于純語(yǔ)言建模范式,可以稱(chēng)之為增強(qiáng)語(yǔ)言模型(ALMs, Augmented Language Models)。

missing token的預(yù)測(cè)目標(biāo)可以讓ALM學(xué)習(xí)推理、使用工具甚至行動(dòng)(act),同時(shí)仍然能夠執(zhí)行標(biāo)準(zhǔn)的自然語(yǔ)言任務(wù),甚至在幾個(gè)基準(zhǔn)數(shù)據(jù)集上性能超過(guò)大多數(shù)常規(guī)LM。

增強(qiáng)語(yǔ)言模型

大型語(yǔ)言模型(LLMs)推動(dòng)了自然語(yǔ)言處理的巨大進(jìn)步,并且已經(jīng)逐步成為數(shù)百萬(wàn)用戶(hù)所用產(chǎn)品的技術(shù)核心,包括寫(xiě)代碼助手Copilot、谷歌搜索引擎以及最近發(fā)布的ChatGPT。

Memorization 與Compositionality 能力相結(jié)合,使得LLM能夠以前所未有的性能水平執(zhí)行各種任務(wù),如語(yǔ)言理解或有條件和無(wú)條件的文本生成,從而為更廣泛的人機(jī)互動(dòng)開(kāi)辟了一條實(shí)用的道路。

然而,目前LLM的發(fā)展仍然受到諸多限制,阻礙了其向更廣泛應(yīng)用場(chǎng)景的部署。比如LLMs經(jīng)常提供非事實(shí)但看似合理的預(yù)測(cè),也被稱(chēng)為幻覺(jué)(hallucinations),很多錯(cuò)誤其實(shí)完全是可以避免的,包括算術(shù)問(wèn)題和在推理鏈中出現(xiàn)的小錯(cuò)誤。

70b02b60-b91e-11ed-bfe3-dac502259ad0.png

此外,許多LLM的突破性能力似乎是隨著規(guī)模的擴(kuò)大而出現(xiàn)的,以可訓(xùn)練參數(shù)的數(shù)量來(lái)衡量的話(huà),之前的研究人員已經(jīng)證明,一旦模型達(dá)到一定的規(guī)模,LLM就能夠通過(guò)few-shot prompting來(lái)完成一些BIG-bench任務(wù)。

盡管最近也有工作訓(xùn)練出了一些較小的LMs,同時(shí)還能保留一些大模型的能力,但當(dāng)下LLMs的規(guī)模和對(duì)數(shù)據(jù)的需求對(duì)于訓(xùn)練和維護(hù)都是不切實(shí)際的:大型模型的持續(xù)學(xué)習(xí)仍然是一個(gè)開(kāi)放的研究問(wèn)題。

Meta的研究人員們認(rèn)為這些問(wèn)題源于LLMs的一個(gè)基本缺陷:其訓(xùn)練過(guò)程就是給定一個(gè)參數(shù)模型和有限的上下文(通常是n個(gè)前后的詞),然后進(jìn)行統(tǒng)計(jì)語(yǔ)言建模。

雖然近年來(lái),由于軟件和硬件的發(fā)展,上下文尺寸n一直在增長(zhǎng),但大多數(shù)模型仍然使用相對(duì)較小的上下文尺寸,所以模型的巨大規(guī)模是儲(chǔ)存沒(méi)有出現(xiàn)在上下文知識(shí)的一個(gè)必要條件,對(duì)于執(zhí)行下游任務(wù)來(lái)說(shuō)也很關(guān)鍵。

70c1b448-b91e-11ed-bfe3-dac502259ad0.png

因此,一個(gè)不斷增長(zhǎng)的研究趨勢(shì)就是用稍微偏離上述的純統(tǒng)計(jì)語(yǔ)言建模范式的方式來(lái)解決這些問(wèn)題。

例如,有一項(xiàng)工作是通過(guò)增加從「相關(guān)外部文件中提取的信息」計(jì)算相關(guān)度來(lái)規(guī)避LLM的有限語(yǔ)境尺寸的問(wèn)題。通過(guò)為L(zhǎng)Ms配備一個(gè)檢索模塊,從數(shù)據(jù)庫(kù)中檢索出給定語(yǔ)境下的此類(lèi)文檔,從而實(shí)現(xiàn)與更大規(guī)模LM的某些能力相匹配,同時(shí)擁有更少的參數(shù)。

需要注意的是,現(xiàn)在產(chǎn)生的模型是非參數(shù)化的,因?yàn)樗梢圆樵?xún)外部數(shù)據(jù)源。更一般的,LM還可以通過(guò)推理策略改善其上下文,以便在生成答案之前生成更相關(guān)的上下文,通過(guò)更多的計(jì)算來(lái)提升性能。

另一個(gè)策略是允許LM利用外部工具,用LM的權(quán)重中不包含的重要缺失信息來(lái)增強(qiáng)當(dāng)前語(yǔ)境。盡管這些工作大多旨在緩解上述LM的缺點(diǎn),但可以直接想到,更系統(tǒng)地用推理和工具來(lái)增強(qiáng)LM,可能會(huì)導(dǎo)致明顯更強(qiáng)大的智能體。

研究人員將這些模型統(tǒng)稱(chēng)為增強(qiáng)語(yǔ)言模型(ALMs)。

隨著這一趨勢(shì)的加速,跟蹤和理解眾多模型變得十分困難,需要對(duì)ALMs的工作進(jìn)行分類(lèi),并對(duì)有時(shí)出于不同目的而使用的技術(shù)術(shù)語(yǔ)進(jìn)行定義。

推理Reasoning

在ALM的背景下,推理是將一個(gè)潛在的復(fù)雜任務(wù)分解成更簡(jiǎn)單的子任務(wù),LM可以自己或使用工具更容易地解決。

目前有各種分解子任務(wù)的方法,例如遞歸或迭代,在某種意義上來(lái)說(shuō),推理類(lèi)似于LeCun于2022年發(fā)表論文「通往自主機(jī)器智能的路線(xiàn)」中定義的計(jì)劃。

70d83be6-b91e-11ed-bfe3-dac502259ad0.png

論文鏈接:

https://openreview.net/pdf?id=BZ5a1r-kVsf

在這篇survey中,推理指的是提高LM中推理能力的各種策略,比如利用少量的幾個(gè)例子進(jìn)行step-by-step推理。雖然目前還沒(méi)有完全理解LM是否真的在推理,或者僅僅是產(chǎn)生了一個(gè)更大的背景,增加了正確預(yù)測(cè)missing tokens的可能性。

鑒于目前的技術(shù)水平,推理可能是一個(gè)被濫用的說(shuō)法,但這個(gè)術(shù)語(yǔ)已經(jīng)在社區(qū)內(nèi)廣泛使用了。在ALM的語(yǔ)境中,推理的一個(gè)更務(wù)實(shí)的定義是在得出prompt的答案之前給模型更多的計(jì)算步驟。

工具Tool

對(duì)于ALM來(lái)說(shuō),工具是一個(gè)外部模塊,通常使用一個(gè)規(guī)則或一個(gè)特殊的token來(lái)調(diào)用,其輸出包含在ALM的上下文中。

工具可以用來(lái)收集外部信息,或者對(duì)虛擬或物理世界產(chǎn)生影響(一般由ALM感知):比如說(shuō)文件檢索器可以用來(lái)作為獲取外部信息的工具,或者用機(jī)器臂對(duì)外部影響進(jìn)行感知。

工具可以在訓(xùn)練時(shí)或推理時(shí)被調(diào)用,更一般地說(shuō),模型需要學(xué)習(xí)與工具的互動(dòng),包括學(xué)習(xí)調(diào)用其API。

行為Act

對(duì)于ALM來(lái)說(shuō),調(diào)用一個(gè)對(duì)虛擬或物理世界有影響的工具并觀察其結(jié)果,通常是將其納入ALM的當(dāng)前上下文。

這篇survey中介紹的一些工作討論了在網(wǎng)絡(luò)中搜索(seraching the web),或者通過(guò)LMs進(jìn)行機(jī)械臂操縱。在略微濫用術(shù)語(yǔ)的情況下,有時(shí)會(huì)把ALM對(duì)一個(gè)工具的調(diào)用表示為一個(gè)行動(dòng)(action),即使沒(méi)有對(duì)外部世界產(chǎn)生影響。

為什么要同時(shí)討論推理和工具?

LM中推理和工具的結(jié)合應(yīng)該允許在沒(méi)有啟發(fā)式的情況下解決廣泛的復(fù)雜任務(wù),即具有更好的泛化能力。

通常情況下,推理會(huì)促進(jìn)LM將一個(gè)給定的問(wèn)題分解成可能更簡(jiǎn)單的子任務(wù),而工具則有助于正確地完成每個(gè)步驟,例如從數(shù)學(xué)運(yùn)算中獲得結(jié)果。

換句話(huà)說(shuō),推理是LM結(jié)合不同工具以解決復(fù)雜任務(wù)的一種方式,而工具則是避免推理失敗和有效分解的一種方式。

兩者都應(yīng)該受益于對(duì)方,并且推理和工具可以放在同一個(gè)模塊里,因?yàn)槎叨际峭ㄟ^(guò)增強(qiáng)LM的上下文來(lái)更好地預(yù)測(cè)missing tokens,盡管是以不同的方式。

為什么要同時(shí)討論工具和行動(dòng)?

收集額外信息的工具和對(duì)虛擬或物理世界產(chǎn)生影響的工具可以被LM以同樣的方式調(diào)用。

例如,輸出python代碼解決數(shù)學(xué)運(yùn)算的LM和輸出python代碼操縱機(jī)械臂的LM之間似乎沒(méi)有什么區(qū)別。

這篇綜述中討論的一些工作已經(jīng)在使用對(duì)虛擬或物理世界產(chǎn)生影響的LM,在這種觀點(diǎn)下,我們可以說(shuō)LM有行動(dòng)的潛力,并期望在LM作為自主智能體的方向上取得重要進(jìn)展。

分類(lèi)方法

研究人員將綜述中介紹的工作分解上述三個(gè)維度,并分別介紹,最后還討論了其他維度的相關(guān)工作。

對(duì)讀者來(lái)說(shuō),應(yīng)該記得,其中很多技術(shù)最初是在LM之外的背景下引入的,如果需要的話(huà),盡可能查看提到的論文的介紹和相關(guān)工作。

最后,盡管綜述專(zhuān)注于LLM,但并非所有的相關(guān)工作都采用了大模型,而是以LM的正確性為宗旨。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    487

    瀏覽量

    10201
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    481

    瀏覽量

    21935
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6941

原文標(biāo)題:ChatGPT之后何去何從?LeCun新作:全面綜述下一代「增強(qiáng)語(yǔ)言模型」

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    通過(guò)電壓轉(zhuǎn)換啟用下一代ADAS域控制器應(yīng)用說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《通過(guò)電壓轉(zhuǎn)換啟用下一代ADAS域控制器應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 11:32 ?0次下載
    通過(guò)電壓轉(zhuǎn)換啟用<b class='flag-5'>下一代</b>ADAS域控制器應(yīng)用說(shuō)明

    實(shí)現(xiàn)具有電平轉(zhuǎn)換功能的下一代無(wú)線(xiàn)信標(biāo)

    電子發(fā)燒友網(wǎng)站提供《實(shí)現(xiàn)具有電平轉(zhuǎn)換功能的下一代無(wú)線(xiàn)信標(biāo).pdf》資料免費(fèi)下載
    發(fā)表于 09-07 10:23 ?0次下載
    實(shí)現(xiàn)具有電平轉(zhuǎn)換功能的<b class='flag-5'>下一代</b>無(wú)線(xiàn)信標(biāo)

    24芯M16插頭在下一代技術(shù)中的潛力

      德索工程師說(shuō)道隨著科技的飛速發(fā)展,下一代技術(shù)正逐漸展現(xiàn)出其獨(dú)特的魅力和潛力。在這背景下,24芯M16插頭作為種高性能、多功能的連接器,將在下一代技術(shù)中發(fā)揮至關(guān)重要的作用。以下是
    的頭像 發(fā)表于 06-15 18:03 ?178次閱讀
    24芯M16插頭在<b class='flag-5'>下一代</b>技術(shù)中的潛力

    賽輪思與NVIDIA合作,利用生成式AI打造下一代車(chē)內(nèi)體驗(yàn)

    AI 驅(qū)動(dòng)的移動(dòng)出行創(chuàng)新企業(yè)與 NVIDIA 合作,打造下一代車(chē)內(nèi)體驗(yàn)。
    的頭像 發(fā)表于 05-23 10:12 ?1117次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的評(píng)測(cè)

    計(jì)算和代碼糾錯(cuò)等。這些場(chǎng)景覆蓋日常生活和學(xué)習(xí)的多個(gè)方面,使得對(duì)話(huà)能力評(píng)測(cè)變得尤為復(fù)雜和關(guān)鍵。為了全面評(píng)估大語(yǔ)言模型在各種應(yīng)用場(chǎng)景下的對(duì)話(huà)能力,研究人員和使用者需要套綜合性的評(píng)測(cè)框架。
    發(fā)表于 05-07 17:12

    【大語(yǔ)言模型:原理與工程實(shí)踐】核心技術(shù)綜述

    我也不打算把網(wǎng)上相關(guān)的信息在總結(jié)下,這樣的話(huà),工作量很大。 我主要看了-大語(yǔ)言模型基礎(chǔ)技術(shù)這節(jié) 大語(yǔ)言模型(Large Language
    發(fā)表于 05-05 10:56

    使用NVIDIA Holoscan for Media構(gòu)建下一代直播媒體應(yīng)用

    NVIDIA Holoscan for Media 現(xiàn)已向所有希望在完全可重復(fù)使用的集群上構(gòu)建下一代直播媒體應(yīng)用的開(kāi)發(fā)者開(kāi)放。
    的頭像 發(fā)表于 04-16 14:04 ?461次閱讀

    谷歌推出新一代模型Gemini 1.5

    近日,谷歌在無(wú)預(yù)警的情況下發(fā)布了其下一代模型——Gemini 1.5,這款模型在性能上實(shí)現(xiàn)了顯著增強(qiáng),并在長(zhǎng)上下文理解方面取得了令人矚目的突破。更令人驚嘆的是,Gemini 1.5甚
    的頭像 發(fā)表于 02-20 13:55 ?716次閱讀

    康寧與天馬微電子宣布共同推出下一代車(chē)載顯示屏

    1月9日,康寧官微宣布與天馬微電子 (Tianma) 展開(kāi)新的合作,利用康寧LivingHinge技術(shù)推出下一代車(chē)載顯示屏。
    的頭像 發(fā)表于 01-10 09:37 ?917次閱讀

    適用于下一代大功率應(yīng)用的XHP?2封裝

    適用于下一代大功率應(yīng)用的XHP?2封裝
    的頭像 發(fā)表于 11-29 17:04 ?757次閱讀
    適用于<b class='flag-5'>下一代</b>大功率應(yīng)用的XHP?2封裝

    媒體聚焦 | ?RENSAS瑞薩公開(kāi)下一代車(chē)用處理器藍(lán)圖,全面擁抱平臺(tái)化

    媒體聚焦 | ?RENSAS瑞薩公開(kāi)下一代車(chē)用處理器藍(lán)圖,全面擁抱平臺(tái)化
    的頭像 發(fā)表于 11-28 13:34 ?451次閱讀
    媒體聚焦 | ?RENSAS瑞薩公開(kāi)<b class='flag-5'>下一代</b>車(chē)用處理器藍(lán)圖,<b class='flag-5'>全面</b>擁抱平臺(tái)化

    如何保障下一代碳化硅 (SiC) 器件的供需平衡

    如何保障下一代碳化硅 (SiC) 器件的供需平衡
    的頭像 發(fā)表于 11-23 17:00 ?318次閱讀
    如何保障<b class='flag-5'>下一代</b>碳化硅 (SiC) 器件的供需平衡

    如何在下一代智能手機(jī)的設(shè)計(jì)中節(jié)約空間?本文提供個(gè)思路

    如何在下一代智能手機(jī)的設(shè)計(jì)中節(jié)約空間?本文提供個(gè)思路
    的頭像 發(fā)表于 11-23 09:06 ?336次閱讀
    如何在<b class='flag-5'>下一代</b>智能手機(jī)的設(shè)計(jì)中節(jié)約空間?本文提供<b class='flag-5'>一</b>個(gè)思路

    避免隱藏的隔離成本設(shè)計(jì)-如何管理項(xiàng)目風(fēng)險(xiǎn)與下一代解決方案

    電子發(fā)燒友網(wǎng)站提供《避免隱藏的隔離成本設(shè)計(jì)-如何管理項(xiàng)目風(fēng)險(xiǎn)與下一代解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 11-22 15:00 ?0次下載
    避免隱藏的隔離成本設(shè)計(jì)-如何管理項(xiàng)目風(fēng)險(xiǎn)與<b class='flag-5'>下一代</b>解決方案

    超越摩爾定律,下一代芯片如何創(chuàng)新?

    摩爾定律,下一代芯片要具有更高的性能、更低的功耗、更多的功能、更廣的應(yīng)用等特點(diǎn)。下一代芯片是信息產(chǎn)業(yè)的核心和驅(qū)動(dòng)力,也是人類(lèi)社會(huì)的創(chuàng)新和進(jìn)步的源泉。其創(chuàng)新主要涉及到
    的頭像 發(fā)表于 11-03 08:28 ?746次閱讀
    超越摩爾定律,<b class='flag-5'>下一代</b>芯片如何創(chuàng)新?