Medusa如何加速大型語(yǔ)言模型（LLM）的生成？

作者：Winnie

今天為大家介紹一個(gè)新技術(shù)—Medusa，它旨在加速大型語(yǔ)言模型（LLM）的生成。盡管其設(shè)計(jì)簡(jiǎn)單，但 Medusa能夠?qū)LM的生成效率提高約2倍。讓我們看看它是怎么做到的吧！

為什么LLM生成低效？

LLM在生成時(shí)的效率問(wèn)題主要是由內(nèi)存讀/寫操作帶來(lái)的延遲，而這個(gè)問(wèn)題源自自動(dòng)回歸解碼過(guò)程的順序性特點(diǎn)。每次的前向傳播都需要頻繁地移動(dòng)模型參數(shù)，盡管這只產(chǎn)生一個(gè)結(jié)果，但卻沒(méi)有完全利用現(xiàn)代硬件的計(jì)算潛能。傳統(tǒng)的解決方式（如增大批次大?。┰贚LM的場(chǎng)景下卻不再適用，因?yàn)檫@不僅會(huì)增加延遲，還會(huì)引發(fā)內(nèi)存問(wèn)題。

不僅如此，這種低效還帶來(lái)了額外的生成成本。例如，GPT-4的生成成本比僅僅處理prompt高了兩倍，Claude2則大約高出3倍。因此，加速LLM的低效生成是一個(gè)亟待解決的問(wèn)題。

Medusa來(lái)了！

面對(duì)推測(cè)性解碼的復(fù)雜性，研究人員推出了Medusa技術(shù)，這個(gè)框架回歸了Transformer模型的本質(zhì)，減少了復(fù)雜度，增強(qiáng)了效率，讓每個(gè)生成階段都能快速產(chǎn)出結(jié)果。當(dāng)將Medusa與基于樹的注意機(jī)制結(jié)合時(shí)，生成速度提高了2到3倍。

接下來(lái)，讓我們看一看Msdusa都做了哪些改進(jìn)吧！

Medusa總體框架

Medusa的核心在于它在LLM的最后隱藏層上增加的多個(gè)Heads，使它們并行工作，預(yù)測(cè)接下來(lái)的內(nèi)容。

當(dāng)將Medusa Heads加入模型時(shí)，你會(huì)發(fā)現(xiàn)，原始模型保持不變，而只有這些Medusa Heads進(jìn)行微調(diào)。在真正使用時(shí)，每個(gè)Medusa Head都會(huì)為其位置產(chǎn)生預(yù)測(cè)，這些預(yù)測(cè)會(huì)被組合、處理，最終給出最佳結(jié)果。

通過(guò)同時(shí)接受更多的tokens來(lái)增強(qiáng)解碼過(guò)程的效率，從而減少了所需的解碼步驟數(shù)量。

Medusa Heads

Medusa Heads與原有的語(yǔ)言模型頭相似，但卻擁有一個(gè)獨(dú)特的優(yōu)勢(shì)：它們可以預(yù)測(cè)多個(gè)即將出現(xiàn)的token，而不僅僅是下一個(gè)。這種方法從Blockwise Parallel Decoding方法中汲取靈感，將每個(gè)Medusa頭設(shè)計(jì)為一個(gè)單層的前饋網(wǎng)絡(luò)，且增強(qiáng)了殘差連接。

訓(xùn)練這些Medusa Heads非常方便！你可以使用用于訓(xùn)練原始模型的同一語(yǔ)料庫(kù)，或者使用模型本身生成一個(gè)新的語(yǔ)料庫(kù)來(lái)訓(xùn)練它們。在訓(xùn)練階段，原始的模型保持靜態(tài)，僅Medusa Heads進(jìn)行微調(diào)。這種有針對(duì)性的訓(xùn)練產(chǎn)生了一個(gè)參數(shù)效率極高的過(guò)程，可以迅速實(shí)現(xiàn)收斂—尤其是與speculative decoding方法中訓(xùn)練單獨(dú)的draft model的計(jì)算密集度相比。

Medusa Heads的表現(xiàn)相當(dāng)出色，它在預(yù)測(cè)“下一個(gè)”token時(shí)的top-1準(zhǔn)確率約為60%。但這僅僅是個(gè)開始，它還有很大的提升空間。

Tree attention

通過(guò)Medusa Heads的測(cè)試，研究人員發(fā)現(xiàn)：雖然預(yù)測(cè)“下下一個(gè)”token的top-1準(zhǔn)確率僅約為60%，但top-5準(zhǔn)確率卻飆升至超過(guò)80%。這一顯著的提高表明，如果我們可以巧妙地利用Medusa Heads做出的多個(gè)top排名預(yù)測(cè)，就可以顯著增加每個(gè)解碼步驟生成的tokens數(shù)量。

實(shí)現(xiàn)這一目標(biāo)的方式是首先構(gòu)造一個(gè)候選集，這個(gè)集合由每個(gè)Medusa Head的預(yù)測(cè)結(jié)果的笛卡爾積形成。然后，依賴圖被編碼到注意力機(jī)制中，允許多個(gè)候選項(xiàng)目并行處理，這是受到圖神經(jīng)網(wǎng)絡(luò)思想的啟發(fā)。例如，在一個(gè)實(shí)際應(yīng)用中，可以從第一個(gè)Medusa頭部獲取前兩個(gè)預(yù)測(cè)，從第二個(gè)頭部獲取前三個(gè)預(yù)測(cè)，并將它們組合成一個(gè)多層樹結(jié)構(gòu)。在這種結(jié)構(gòu)中，一個(gè)注意力掩碼被實(shí)施，僅限制注意力于一個(gè)token的前一個(gè)token，從而保持歷史上下文。通過(guò)這種方式，可以同時(shí)處理多個(gè)候選項(xiàng)，而無(wú)需增加批次大小。

下圖是Tree attention機(jī)制用于并行處理多個(gè)候選項(xiàng)目的一個(gè)可視化示例。在一個(gè)示例中，來(lái)自第一個(gè)Medusa頭部的前兩個(gè)預(yù)測(cè)和來(lái)自第二個(gè)頭部的前三個(gè)預(yù)測(cè)產(chǎn)生了2*3=6個(gè)候選項(xiàng)。這些候選項(xiàng)中的每一個(gè)都對(duì)應(yīng)于樹結(jié)構(gòu)中的一個(gè)不同分支。為了保證每個(gè)token只能訪問(wèn)其前面的token，注意力掩碼，該掩碼僅允許注意力從當(dāng)前token流向其前面的token。位置編碼的位置指數(shù)將根據(jù)這種結(jié)構(gòu)進(jìn)行調(diào)整。通過(guò)這種方式，可以確保歷史上下文的完整性和連貫性，同時(shí)提高解碼步驟的效率和準(zhǔn)確性。

值得注意的是，與一些獨(dú)立的研究相比，該方法傾向于使用簡(jiǎn)化形式的樹狀注意力，其中樹的模式在推斷期間是規(guī)則和固定的，這允許預(yù)處理樹狀注意力掩碼，進(jìn)而提高效率。通過(guò)創(chuàng)新這種解碼方法，它不僅提供了一個(gè)新的解碼路徑，而且為更精確和高效的未來(lái)預(yù)測(cè)打開了新的可能性。

Typical acceptance

在早期關(guān)于投機(jī)解碼的研究中，重要性采樣技術(shù)用于產(chǎn)生與原始模型預(yù)測(cè)緊密相符的多樣化輸出。但隨后的研究表明，隨著“creativity dial”或采樣溫度的增加，這種方法的效率會(huì)降低。簡(jiǎn)而言之，如果一個(gè)draft model與原始模型一樣優(yōu)秀，理論上應(yīng)接受其所有輸出，使過(guò)程極為高效。但是重要性采樣可能會(huì)在某個(gè)階段拒絕這種方案。

實(shí)際上，人們常常僅調(diào)整采樣溫度來(lái)控制模型的創(chuàng)造力，而不是嚴(yán)格匹配原始模型的分布。那么為什么不只是接受看似合理的候選項(xiàng)呢？Typical acceptance策略受到截?cái)嗖蓸拥膯l(fā)，目的是選取根據(jù)原始模型被視為足夠可能的候選項(xiàng)。通過(guò)設(shè)置基于原始模型預(yù)測(cè)概率的閾值，如果候選項(xiàng)超過(guò)這個(gè)閾值，則將其接受。

在技術(shù)語(yǔ)言中，我們采用硬閾值和依賴于熵的閾值中的最小值來(lái)決定是否接受一個(gè)候選項(xiàng)，如截?cái)嗖蓸又兴?。這確保在解碼期間選擇了有意義的標(biāo)記和合理的延續(xù)。第一個(gè)標(biāo)記總是通過(guò)貪婪解碼被接受，確保每一步至少生成一個(gè)標(biāo)記。最終輸出是通過(guò)接受測(cè)試的最長(zhǎng)序列。這種方法的優(yōu)點(diǎn)在于其適應(yīng)性。如果將采樣溫度設(shè)置為零，它將簡(jiǎn)單地退化為最有效的形式——貪婪解碼。提高溫度會(huì)使方法變得更加高效，允許更長(zhǎng)的接受序列，這一點(diǎn)已通過(guò)嚴(yán)格測(cè)試得到驗(yàn)證。

性能測(cè)試

在Vicuna模型上測(cè)試了Medusa，這些模型是特別為聊天應(yīng)用優(yōu)化和調(diào)整的羊駝模型，其大小不同，參數(shù)數(shù)量分別為7B、13B和33B。目標(biāo)是衡量Medusa在現(xiàn)實(shí)世界的聊天機(jī)器人環(huán)境中能夠多大程度上加速這些模型的運(yùn)行。

訓(xùn)練Medusa頭部選擇了簡(jiǎn)單的方式，使用了公開的ShareGPT數(shù)據(jù)集，這是最初用于訓(xùn)練Vicuna模型的數(shù)據(jù)的一個(gè)子集，只進(jìn)行了一個(gè)時(shí)代的訓(xùn)練。

這里的重點(diǎn)是——整個(gè)訓(xùn)練過(guò)程可以在幾小時(shí)到一天之內(nèi)完成，具體取決于模型的大小，全部在單個(gè)A100-80G GPU上完成。顯著的是，Medusa可以與量化基模型輕松結(jié)合，從而減少內(nèi)存需求。為了利用這一優(yōu)勢(shì)，在訓(xùn)練33B模型時(shí)使用了8位量化。

為模擬現(xiàn)實(shí)環(huán)境，采用了MT測(cè)試臺(tái)進(jìn)行評(píng)估。結(jié)果是令人鼓舞的：Medusa借助其簡(jiǎn)單的設(shè)計(jì)，在各種用例中穩(wěn)定實(shí)現(xiàn)了約2倍的實(shí)際運(yùn)行時(shí)間加速。顯著的是，有了Medusa的優(yōu)化，33B參數(shù)的Vicuna模型可以與13B模型一樣快速運(yùn)行。

結(jié)語(yǔ)

Medusa技術(shù)致力于通過(guò)多層頭部預(yù)測(cè)方法來(lái)加速LLM的語(yǔ)言生成速度。該研究中引入了多個(gè)Medusa頭和Tree attention機(jī)制，通過(guò)預(yù)測(cè)多個(gè)即將出現(xiàn)的標(biāo)記而非一個(gè)來(lái)優(yōu)化生成速度，同時(shí)還保持了高準(zhǔn)確率。此外，研究還提出了Typical acceptance方案，它基于原始模型的預(yù)測(cè)概率來(lái)選擇候選項(xiàng)，而不是依賴重要性抽樣，使得創(chuàng)意輸出更為高效和自適應(yīng)。

在實(shí)際測(cè)試中，Medusa成功地將Vicuna模型的運(yùn)行速度提高了大約兩倍，證明了其在現(xiàn)實(shí)世界的聊天機(jī)器人環(huán)境中的實(shí)用性和效果。整體來(lái)看，Medusa為開發(fā)更快、更有效的聊天機(jī)器人開辟了新的可能，顯示出在語(yǔ)言模型生成領(lǐng)域的巨大潛力。

編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
語(yǔ)言模型(9992) 語(yǔ)言模型(9992)
LLM(229) LLM(229)

評(píng)論

相關(guān)推薦

突破邊界：高性能計(jì)算引領(lǐng)LLM駛向通用人工智能AGI的創(chuàng)新紀(jì)元

ChatGPT的成功帶動(dòng)整個(gè)AIGC產(chǎn)業(yè)的發(fā)展，尤其是LLM（大型語(yǔ)言模型，大語(yǔ)言模型）、NLP、高性能計(jì)算和深度學(xué)習(xí)等領(lǐng)域。LLM的發(fā)展將為全球和中國(guó)AI芯片、AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力，據(jù)估算，LLM將為全球和中國(guó)AI服務(wù)器帶來(lái)約891.2億美元和338.2億美元的市場(chǎng)空間。

2023-06-25 14:31:15

575

大型語(yǔ)言模型在關(guān)鍵任務(wù)和實(shí)際應(yīng)用中的挑戰(zhàn)

大型語(yǔ)言模型的出現(xiàn)極大地推動(dòng)了自然語(yǔ)言處理領(lǐng)域的進(jìn)步，但同時(shí)也存在一些局限性，比如模型可能會(huì)產(chǎn)生看似合理但實(shí)際上是錯(cuò)誤或虛假的內(nèi)容，這一現(xiàn)象被稱為幻覺(jué)（hallucination）?；糜X(jué)的存在使得

2023-08-15 09:33:45

1090

低比特量化技術(shù)如何幫助LLM提升性能

針對(duì)大語(yǔ)言模型 (LLM) 在部署過(guò)程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對(duì)于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

探索高效的大型語(yǔ)言模型！大型語(yǔ)言模型的高效學(xué)習(xí)方法

在大型語(yǔ)言模型（LLMs）的應(yīng)用中，提示工程（Prompt Engineering）是一種關(guān)鍵技術(shù)，用于引導(dǎo)模型生成特定輸出或執(zhí)行特定任務(wù)。通過(guò)精心設(shè)計(jì)的提示，可以顯著提高LLMs的性能和適用性。本文將介紹提示工程的主要方法和技巧，包括少樣本提示、提示壓縮和提示生成。

2023-12-13 14:21:47

274

使用基于Transformers的API在CPU上實(shí)現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個(gè)創(chuàng)新工具包，可基于英特爾架構(gòu)平臺(tái)，尤其是第四代英特爾至強(qiáng) 可擴(kuò)展處理器（代號(hào) SapphireRapids，SPR）顯著加速基于Transformers的大語(yǔ)言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

NVIDIA 推出大型語(yǔ)言模型云服務(wù)以推進(jìn) AI 和數(shù)字生物學(xué)的發(fā)展

NVIDIA NeMo 大型語(yǔ)言模型（LLM）服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型；NVIDIA BioNeMo 服務(wù)幫助研究人員生成和預(yù)測(cè)分子、蛋白質(zhì)及 DNA ? 美國(guó)加利福尼亞州圣克拉拉

2022-09-21 15:24:52

434

2023年科技圈熱詞“大語(yǔ)言模型”，與自然語(yǔ)言處理有何關(guān)系

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）大語(yǔ)言模型（LLM）是基于海量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型。它不僅能夠生成自然語(yǔ)言文本，還能夠深入理解文本含義，處理各種自然語(yǔ)言任務(wù)，如文本摘要、問(wèn)答、翻譯

2024-01-02 09:28:33

1267

LuxStudio增材制造晶格模型自動(dòng)生成平臺(tái)

LuxStudio增材制造晶格模型自動(dòng)生成平臺(tái)｜LuxCreo目前，市面上大多數(shù)的晶格設(shè)計(jì)軟件幾乎都有局限性，比如晶格種類過(guò)少、生成的晶胞質(zhì)量本身有問(wèn)題、效果不理想，另外軟件操作門檻較高等，種種弊端

2022-11-09 10:43:02

Medusa登錄暴力工具

./oschina_soft/medusa.zip

2022-05-20 09:17:05

NVIDIA NeMo最新語(yǔ)言模型服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型

NVIDIA NeMo 大型語(yǔ)言模型（LLM）服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型；NVIDIA BioNeMo 服務(wù)幫助研究人員生成和預(yù)測(cè)分子、蛋白質(zhì)及 DNA

2022-09-22 10:42:29

742

KT利用NVIDIA AI平臺(tái)訓(xùn)練大型語(yǔ)言模型

韓國(guó)先進(jìn)的移動(dòng)運(yùn)營(yíng)商構(gòu)建包含數(shù)百億個(gè)參數(shù)的大型語(yǔ)言模型，并使用 NVIDIA DGX SuperPOD 平臺(tái)和 NeMo Megatron 框架訓(xùn)練該模型。

2022-09-27 09:24:30

915

NVIDIA AI平臺(tái)為大型語(yǔ)言模型帶來(lái)巨大收益

隨著大型語(yǔ)言模型（ LLM ）的規(guī)模和復(fù)雜性不斷增長(zhǎng)， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高達(dá) 30% 的訓(xùn)練速度。

2022-10-10 15:39:42

644

基于用于自然語(yǔ)言生成的“語(yǔ)境調(diào)優(yōu)”技術(shù)

自然語(yǔ)言生成（又稱為文本生成）旨在基于輸入數(shù)據(jù)用人類語(yǔ)言生成合理且可讀的文本。隨著預(yù)訓(xùn)練語(yǔ)言模型的發(fā)展，GPT-3，BART等模型逐漸成為了生成任務(wù)的主流模型。近年來(lái)，為了利用預(yù)訓(xùn)練階段編碼的豐富知識(shí)，提示學(xué)習(xí)成為了一個(gè)簡(jiǎn)單而強(qiáng)大的方法。

2022-10-14 15:38:43

762

基因組學(xué)大型語(yǔ)言模型在多項(xiàng)任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

。這一聯(lián)合團(tuán)隊(duì)的研究指出，經(jīng)過(guò)基因組學(xué)訓(xùn)練的大型語(yǔ)言模型（LLM）可將應(yīng)用擴(kuò)展到大量基因組學(xué)任務(wù)。該團(tuán)隊(duì)使用 NVIDIA 的超級(jí)計(jì)算機(jī) Cambridge-1 來(lái)訓(xùn)練參數(shù)規(guī)模從 500M 到 2.5B 不等的各種大型語(yǔ)言模型（LLM）。這些模型在各種基因組數(shù)據(jù)集上進(jìn)行了訓(xùn)練，以探

2023-01-17 01:05:04

444

支持Python和Java的BigCode開源輕量級(jí)語(yǔ)言模型

BigCode 是一個(gè)開放的科學(xué)合作組織，致力于開發(fā)大型語(yǔ)言模型。近日他們開源了一個(gè)名為 SantaCoder 的語(yǔ)言模型，該模型擁有 11 億個(gè)參數(shù)

2023-01-17 14:29:53

692

介紹一種基于Transformer的大語(yǔ)言模型

大模型的研究者和大公司出于不同的動(dòng)機(jī)站位 LLM，研究者出于對(duì) LLM 的突現(xiàn)能力 (emergent ability) 的好奇和對(duì) LLM 對(duì) NLP 領(lǐng)域能力邊界的拓展、而大公司可能更多出自于商業(yè)利益考量；

2023-02-21 18:05:10

940

SOTA生成式模型：9大類別21個(gè)模型合集

過(guò)去的兩年時(shí)間里，AI界的大型生成模型發(fā)布呈井噴之勢(shì)，尤其是Stable Diffusion開源和ChatGPT開放接口后，更加激發(fā)了業(yè)界對(duì)生成式模型的熱情。

2023-02-23 11:22:38

778

大型語(yǔ)言模型有哪些用途？

大型語(yǔ)言模型能識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。 AI 應(yīng)用在大型語(yǔ)言模型的幫助下，可用于解決總結(jié)文章、編寫故事和參與長(zhǎng)對(duì)話等多種繁重工作。大型語(yǔ)言模型（LLM）是一種深度學(xué)習(xí)算法，可以

2023-02-23 19:50:04

3887

大型語(yǔ)言模型有哪些用途？大型語(yǔ)言模型如何運(yùn)作呢？

大型語(yǔ)言模型能識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。

2023-03-08 13:57:00

6989

NVIDIA 為全球企業(yè)帶來(lái)生成式 AI 推出用于創(chuàng)建大型語(yǔ)言模型和視覺(jué)模型的云服務(wù)

和運(yùn)行自定義大型語(yǔ)言模型和生成式AI模型，這些模型專為企業(yè)所在領(lǐng)域的特定任務(wù)而創(chuàng)建，并且在專有數(shù)據(jù)上訓(xùn)練。 ? Getty Images、Morningstar、Quantiphi、Shutterstock公

2023-03-22 13:45:40

261

GTC23 | NVIDIA 為全球企業(yè)帶來(lái)生成式 AI，推出用于創(chuàng)建大型語(yǔ)言模型和視覺(jué)模型的云服務(wù)

能夠構(gòu)建、完善和運(yùn)行自定義大型語(yǔ)言模型和生成式 AI 模型，這些模型專為企業(yè)所在領(lǐng)域的特定任務(wù)而創(chuàng)建，并且在專有數(shù)據(jù)上訓(xùn)練。 Getty Images、Morningstar、Quantiphi、Shutterst

2023-03-23 06:50:04

365

GTC23 | NVIDIA 發(fā)布大型語(yǔ)言模型和生成式 AI 服務(wù)以推動(dòng)生命科學(xué)研發(fā)

年 3 月 21 日 – NVIDIA 今日推出一整套用于自定義 AI 基礎(chǔ)模型的生成式 AI 云服務(wù)。這些服務(wù)將加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)等領(lǐng)域的研究。作為

2023-03-23 06:55:03

328

GTC23 | NVIDIA 為全球企業(yè)帶來(lái)生成式 AI，推出用于創(chuàng)建大型語(yǔ)言模型和視覺(jué)模型的云服務(wù)

2023-03-25 15:20:04

285

大型語(yǔ)言模型綜述全新出爐！從T5到GPT-4最全盤點(diǎn)

LLM 的涌現(xiàn)能力被正式定義為「在小型模型中不存在但在大型模型中出現(xiàn)的能力」，這是 LLM 與以前的 PLM 區(qū)分開來(lái)的最顯著特征之一。當(dāng)出現(xiàn)這種新的能力時(shí)，它還引入了一個(gè)顯著的特征：當(dāng)規(guī)模達(dá)到一定水平時(shí)，性能顯著高于隨機(jī)的狀態(tài)。

2023-04-04 14:16:28

870

獲取大語(yǔ)言模型（LLM）核心開發(fā)技能，報(bào)名 NVIDIA DLI 實(shí)戰(zhàn)培訓(xùn)

ChatGPT 的誕生，帶來(lái)了 AI 產(chǎn)業(yè)的 “iPhone 時(shí)刻”，其成功背后大語(yǔ)言模型（Large Language Model，LLM）的商業(yè)價(jià)值正逐步被揭示和成為現(xiàn)實(shí)。隨著 LLM 技術(shù)

2023-04-05 00:25:03

416

各種大語(yǔ)言模型是徹底被解封了

基礎(chǔ) LLM 基本信息表，GPT-style 表示 decoder-only 的自回歸語(yǔ)言模型，T5-style 表示 encoder-decoder 的語(yǔ)言模型，GLM-style 表示 GLM 特殊的模型結(jié)構(gòu)，Multi-task 是指 ERNIE 3.0 的模型結(jié)構(gòu)

2023-04-20 11:25:44

1071

一套開源的大型語(yǔ)言模型（LLM）—— StableLM

對(duì)于任何沒(méi)有額外微調(diào)和強(qiáng)化學(xué)習(xí)的預(yù)訓(xùn)練大型語(yǔ)言模型來(lái)說(shuō)，用戶得到的回應(yīng)質(zhì)量可能參差不齊，并且可能包括冒犯性的語(yǔ)言和觀點(diǎn)。這有望隨著規(guī)模、更好的數(shù)據(jù)、社區(qū)反饋和優(yōu)化而得到改善。

2023-04-24 10:07:06

2168

利用大語(yǔ)言模型做多模態(tài)任務(wù)

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。

2023-05-10 16:53:15

701

如何利用LLM做多模態(tài)任務(wù)？

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究?jī)r(jià)值的。

2023-05-11 17:09:16

648

大語(yǔ)言模型的多語(yǔ)言機(jī)器翻譯能力分析

以ChatGPT為代表的大語(yǔ)言模型（Large Language Models, LLM）在機(jī)器翻譯（Machine Translation, MT）任務(wù)上展現(xiàn)出了驚人的潛力。

2023-05-17 09:56:26

903

邱錫鵬團(tuán)隊(duì)提出SpeechGPT：具有內(nèi)生跨模態(tài)能力的大語(yǔ)言模型

雖然現(xiàn)有的級(jí)聯(lián)方法或口語(yǔ)語(yǔ)言模型能夠感知和生成語(yǔ)音，但仍存在一些限制。首先，在級(jí)聯(lián)模型中，LLM 僅充當(dāng)內(nèi)容生成器。由于語(yǔ)音和文本的表示沒(méi)有對(duì)齊，LLM 的知識(shí)無(wú)法遷移到語(yǔ)音模態(tài)中。

2023-05-22 10:19:29

382

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語(yǔ)言模型（LLM）在各種自然語(yǔ)言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時(shí)，多模態(tài)大型語(yǔ)言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

417

如何利用LLM做多模態(tài)任務(wù)？

2023-05-22 15:57:33

466

大型語(yǔ)言模型能否捕捉到它們所處理和生成的文本中的語(yǔ)義信息

確實(shí)能學(xué)習(xí)和表示文本的意義。雖然大型預(yù)訓(xùn)練語(yǔ)言模型（LLM）在一系列下游任務(wù)中展現(xiàn)出飛速提升的性能，但它們是否真的理解其使用和生成的文本語(yǔ)義？長(zhǎng)期以來(lái)，AI社區(qū)對(duì)這一問(wèn)題存在很大的分歧。有一種猜測(cè)是，純粹基于語(yǔ)言的形式（例

2023-05-25 11:34:11

434

微軟將向美國(guó)政府客戶提供OpenAI的GPT模型

微軟增加了對(duì)大型語(yǔ)言模型（llm）的支持。openai推出chatgpt后，llm的使用大幅增加，微軟持有openai的股份，許多類型的公司爭(zhēng)相在llm上構(gòu)建功能。

2023-06-08 10:35:43

759

淺析AI大型語(yǔ)言模型研究的發(fā)展歷程

大型語(yǔ)言模型研究的發(fā)展有三條技術(shù)路線：Bert 模式、GPT 模式、混合模式。其中國(guó)內(nèi)大多采用混合模式，多數(shù)主流大型語(yǔ)言模型走的是 GPT 技術(shù)路線，直到 2022 年底在 GPT-3.5 的基礎(chǔ)上產(chǎn)生了 ChatGPT。

2023-06-09 12:34:53

3162

大型語(yǔ)言模型（LLM）的自定義訓(xùn)練：包含代碼示例的詳細(xì)指南

近年來(lái)，像 GPT-4 這樣的大型語(yǔ)言模型（LLM）因其在自然語(yǔ)言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是，要根據(jù)特定任務(wù)或領(lǐng)域定制LLM，定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細(xì)分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

1782

GPT總設(shè)計(jì)師：大型語(yǔ)言模型的未來(lái)

他預(yù)計(jì)，深度學(xué)習(xí)和大型語(yǔ)言模型會(huì)繼續(xù)發(fā)展：這個(gè)領(lǐng)域的未來(lái)可能會(huì)有一小部分重大突破，加之許多細(xì)微改進(jìn)，所有這些都將融入到一個(gè)龐大而復(fù)雜的工程體系。他還給出了一些有趣、可執(zhí)行的思想實(shí)驗(yàn)。

2023-06-12 16:38:48

262

Macaw-LLM：具有圖像、音頻、視頻和文本集成的多模態(tài)語(yǔ)言建模

盡管指令調(diào)整的大型語(yǔ)言模型 (LLM) 在各種 NLP 任務(wù)中表現(xiàn)出卓越的能力，但它們?cè)谖谋疽酝獾钠渌麛?shù)據(jù)模式上的有效性尚未得到充分研究。在這項(xiàng)工作中，我們提出了 Macaw-LLM，一種新穎的多模式 LLM，它無(wú)縫集成了視覺(jué)、音頻和文本信息。

2023-06-19 10:35:33

876

基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)如何測(cè)試大語(yǔ)言模型(LLM)的純因果推理能力

? 因果推理是人類智力的標(biāo)志之一。因果關(guān)系NLP領(lǐng)域近年來(lái)引起了人們的極大興趣，但其主要依賴于從常識(shí)知識(shí)中發(fā)現(xiàn)因果關(guān)系。本研究提出了一個(gè)基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)來(lái)測(cè)試大語(yǔ)言模型(LLM

2023-06-20 15:39:05

1223

基于Transformer的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制

本文旨在更好地理解基于 Transformer 的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制，以提高它們的可靠性和可解釋性。隨著大型語(yǔ)言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內(nèi)部

2023-06-25 15:08:49

991

大型語(yǔ)言模型的應(yīng)用

?? 大型語(yǔ)言模型（LLM）是一種深度學(xué)習(xí)算法，可以通過(guò)大規(guī)模數(shù)據(jù)集訓(xùn)練來(lái)學(xué)習(xí)識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。大語(yǔ)言模型（LLM）代表著 AI 領(lǐng)域的重大進(jìn)步，并有望通過(guò)習(xí)得的知識(shí)改變

2023-07-05 10:27:35

1463

大模型、預(yù)訓(xùn)練對(duì)汽車行業(yè)的影響 AI加速芯片恐失去市場(chǎng)

大模型最初叫Large languagemodel，LLM，即大規(guī)模語(yǔ)言模型，其沒(méi)有準(zhǔn)確的定義，在2018年一般定義為參數(shù)達(dá)到數(shù)十億以上的模型。

2023-07-05 11:08:07

427

最新綜述！當(dāng)大型語(yǔ)言模型（LLM）遇上知識(shí)圖譜：兩大技術(shù)優(yōu)勢(shì)互補(bǔ)

LLM 是黑箱模型，缺乏可解釋性，因此備受批評(píng)。LLM 通過(guò)參數(shù)隱含地表示知識(shí)。因此，我們難以解釋和驗(yàn)證 LLM 獲得的知識(shí)。此外，LLM 是通過(guò)概率模型執(zhí)行推理，而這是一個(gè)非決斷性的過(guò)程。對(duì)于 LLM 用以得出預(yù)測(cè)結(jié)果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

機(jī)器人接入大模型直接聽懂人話，日常操作輕松完成！

接著，LLM（大語(yǔ)言模型）根據(jù)這些內(nèi)容編寫代碼，所生成代碼與VLM（視覺(jué)語(yǔ)言模型）進(jìn)行交互，指導(dǎo)系統(tǒng)生成相應(yīng)的操作指示地圖，即3D Value Map。

2023-07-11 14:31:01

587

語(yǔ)言模型的發(fā)展歷程基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型解析

簡(jiǎn)單來(lái)說(shuō)，語(yǔ)言模型能夠以某種方式生成文本。它的應(yīng)用十分廣泛，例如，可以用語(yǔ)言模型進(jìn)行情感分析、標(biāo)記有害內(nèi)容、回答問(wèn)題、概述文檔等等。但理論上，語(yǔ)言模型的潛力遠(yuǎn)超以上常見任務(wù)。

2023-07-14 11:45:40

454

基于MNN在個(gè)人設(shè)備上流暢運(yùn)行大語(yǔ)言模型該如何實(shí)現(xiàn)呢？

LLM（大語(yǔ)言模型）因其強(qiáng)大的語(yǔ)言理解能力贏得了眾多用戶的青睞，但LLM龐大規(guī)模的參數(shù)導(dǎo)致其部署條件苛刻；

2023-07-20 10:49:29

655

2023年發(fā)布的25個(gè)開源大型語(yǔ)言模型總結(jié)

來(lái)源： DeepHub IMBA 大型語(yǔ)言模型(llm)是一種人工智能(AI)，在大量文本和代碼數(shù)據(jù)集上進(jìn)行訓(xùn)練。它們可以用于各種任務(wù)，包括生成文本、翻譯語(yǔ)言和編寫不同類型的創(chuàng)意內(nèi)容。今年開始

2023-07-28 12:20:02

440

ToolLLM：促進(jìn)大型語(yǔ)言模型掌握16000+真實(shí)世界的APIs

盡管開源大語(yǔ)言模型 (LLM) 及其變體（例如 LLaMA 和 Vicuna）取得了進(jìn)步，但它們?cè)趫?zhí)行更高級(jí)別的任務(wù)方面仍然受到很大限制，例如遵循人類指令使用外部工具 (API)。

2023-08-02 16:27:52

535

ChatGPT等大型語(yǔ)言模型的出現(xiàn)會(huì)帶來(lái)哪些風(fēng)險(xiǎn)

近日，美智庫(kù)蘭德公司高級(jí)工程師克里斯托弗·莫頓(Christopher Mouton)在C4ISRNET網(wǎng)站撰文，分析ChatGPT等大型語(yǔ)言模型的出現(xiàn)給國(guó)家安全帶來(lái)的新風(fēng)險(xiǎn)。主要觀點(diǎn)如下：

2023-08-04 11:44:53

304

NVIDIA 與 Hugging Face 將連接數(shù)百萬(wàn)開發(fā)者與生成式 AI 超級(jí)計(jì)算

NVIDIA DGX Cloud 集成到 Hugging Face 平臺(tái)將加速大語(yǔ)言模型（LLM）的訓(xùn)練和調(diào)優(yōu)，簡(jiǎn)化了幾乎每個(gè)行業(yè)的模型定制 ? ? 洛杉磯 — SIGGRAPH — 2023

2023-08-09 11:41:59

100

NVIDIA 與 Hugging Face 將連接數(shù)百萬(wàn)開發(fā)者與生成式 AI 超級(jí)計(jì)算

NVIDIA DGX Cloud 集成到 Hugging Face 平臺(tái)將加速大語(yǔ)言模型（LLM）的訓(xùn)練和調(diào)優(yōu)，簡(jiǎn)化了幾乎每個(gè)行業(yè)的模型定制

2023-08-09 11:38:24

653

2023年發(fā)布的25個(gè)開源大型語(yǔ)言模型總結(jié)

大型語(yǔ)言模型(llm)是一種人工智能(AI)，在大量文本和代碼數(shù)據(jù)集上進(jìn)行訓(xùn)練。它們可以用于各種任務(wù)，包括生成文本、翻譯語(yǔ)言和編寫不同類型的創(chuàng)意內(nèi)容。今年開始，人們對(duì)開源LLM越來(lái)越感興趣。這些模型

2023-08-01 00:21:27

554

清華大學(xué)大語(yǔ)言模型綜合性能評(píng)估報(bào)告發(fā)布！哪個(gè)模型更優(yōu)秀？

近日，清華大學(xué)新聞與傳播學(xué)院發(fā)布了《大語(yǔ)言模型綜合性能評(píng)估報(bào)告》，該報(bào)告對(duì)目前市場(chǎng)上的7個(gè)大型語(yǔ)言模型進(jìn)行了全面的綜合評(píng)估。近年，大語(yǔ)言模型以其強(qiáng)大的自然語(yǔ)言處理能力，成為AI領(lǐng)域的一大熱點(diǎn)。它們

2023-08-10 08:32:01

607

MediaTek運(yùn)用Meta Llama 2大語(yǔ)言模型，賦能終端設(shè)備生成式AI應(yīng)用

2023 年 8 月 24 日 – MediaTek今日宣布利用Meta新一代開源大語(yǔ)言模型（LLM）Llama 2 以及MediaTek先進(jìn)的AI處理器（APU）和完整的AI開發(fā)平臺(tái)

2023-08-24 13:41:03

225

Meta發(fā)布一款可以使用文本提示生成代碼的大型語(yǔ)言模型Code Llama

今天，Meta發(fā)布了Code Llama，一款可以使用文本提示生成代碼的大型語(yǔ)言模型（LLM）。

2023-08-25 09:06:57

885

如何使用加速PyTorrch2.0變異器

加快大型語(yǔ)言模型與加速變形金剛

2023-09-04 16:15:12

281

如何加速生成2 PyTorch擴(kuò)散模型

加速生成2 PyTorch擴(kuò)散模型

2023-09-04 16:09:08

782

FPGA加速語(yǔ)言模型如何重塑生成式人工智能

大語(yǔ)言模型的構(gòu)建通常需要一個(gè)大規(guī)模的系統(tǒng)來(lái)執(zhí)行該模型，這個(gè)模型會(huì)持續(xù)變大，在其發(fā)展到一定程度后，僅靠在CPU上的運(yùn)行就不再具有成本、功耗或延遲的優(yōu)勢(shì)了。

2023-08-31 15:34:36

505

訓(xùn)練大語(yǔ)言模型帶來(lái)的硬件挑戰(zhàn)

生成式AI和大語(yǔ)言模型（LLM）正在以難以置信的方式吸引全世界的目光，本文簡(jiǎn)要介紹了大語(yǔ)言模型，訓(xùn)練這些模型帶來(lái)的硬件挑戰(zhàn)，以及GPU和網(wǎng)絡(luò)行業(yè)如何針對(duì)訓(xùn)練的工作負(fù)載不斷優(yōu)化硬件。

2023-09-01 17:14:56

1046

FPGA加速器支撐ChatGPT類大語(yǔ)言模型創(chuàng)新

，大型語(yǔ)言模型（Large Language Models，LLM）徹底改變了自然語(yǔ)言處理領(lǐng)域，使機(jī)器能夠生成類似人類的文本并進(jìn)行有意義的對(duì)話。這些模型，例如OpenAI的GPT，擁有驚人的語(yǔ)言理解和生成能力。它們可以被用于廣泛的自然語(yǔ)言處理任務(wù)，包括文本生成、翻譯、自動(dòng)摘要、情緒分析等

2023-09-04 16:55:25

345

虹科分享 | 谷歌Vertex AI平臺(tái)使用Redis搭建大語(yǔ)言模型

基礎(chǔ)模型和高性能數(shù)據(jù)層這兩個(gè)基本組件始終是創(chuàng)建高效、可擴(kuò)展語(yǔ)言模型應(yīng)用的關(guān)鍵，利用Redis搭建大語(yǔ)言模型，能夠?qū)崿F(xiàn)高效可擴(kuò)展的語(yǔ)義搜索、檢索增強(qiáng)生成、LLM 緩存機(jī)制、LLM記憶和持久

2023-09-18 11:26:49

316

大語(yǔ)言模型（LLM）預(yù)訓(xùn)練數(shù)據(jù)集調(diào)研分析

大語(yǔ)言模型涉及數(shù)據(jù)的通常有有多個(gè)階段（Aligning language models to follow instructions [1] ）：pre-train、sft（supervised

2023-09-19 10:00:06

506

從原理到代碼理解語(yǔ)言模型訓(xùn)練和推理，通俗易懂，快速修煉LLM

要理解大語(yǔ)言模型（LLM），首先要理解它的本質(zhì)，無(wú)論預(yù)訓(xùn)練、微調(diào)還是在推理階段，核心都是next token prediction，也就是以自回歸的方式從左到右逐步生成文本。

2023-09-19 16:25:47

519

mlc-llm對(duì)大模型推理的流程及優(yōu)化方案

在 MLC-LLM 部署RWKV World系列模型實(shí)戰(zhàn)（3B模型Mac M2解碼可達(dá)26tokens/s）中提到要使用mlc-llm部署模型首先需要一個(gè)編譯過(guò)程，將原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

SambaNova即將建立并運(yùn)行自己的大型語(yǔ)言模型

隨著各大公司爭(zhēng)相加入人工智能的潮流，芯片和人才供不應(yīng)求。初創(chuàng)公司SambaNova（https://sambanova.ai/）聲稱，其新處理器可以幫助公司在幾天內(nèi)建立并運(yùn)行自己的大型語(yǔ)言模型

2023-09-27 16:10:51

305

怎樣使用FHE實(shí)現(xiàn)加密大語(yǔ)言模型？

近來(lái)，大語(yǔ)言模型 (LLM) 已被證明是提高編程、內(nèi)容生成、文本分析、網(wǎng)絡(luò)搜索及遠(yuǎn)程學(xué)習(xí)等諸多領(lǐng)域生產(chǎn)力的可靠工具。

2023-10-19 09:13:57

410

周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)，將幫助您了解 NVIDIA 開源大型語(yǔ)言模型（LLM）推理加速庫(kù) TensorRT-LLM ?及其功能

2023-10-26 09:05:02

174

現(xiàn)已公開發(fā)布！歡迎使用 NVIDIA TensorRT-LLM 優(yōu)化大語(yǔ)言模型推理

NVIDIA 于 2023 年 10 月 19 日公開發(fā)布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優(yōu)化最新的大語(yǔ)言模型（Large Language Models）的推理性

2023-10-27 20:05:02

478

在線研討會(huì) | NVIDIA 加速汽車行業(yè)大語(yǔ)言模型的開發(fā)與應(yīng)用

，與您面對(duì)面探討汽車行業(yè)前沿趨勢(shì)與未來(lái)風(fēng)向標(biāo)。大語(yǔ)言模型（LLM）的發(fā)展如火如荼，在汽車行業(yè)，LLM 可用于自動(dòng)駕駛加速訓(xùn)練和推理、智能汽車用戶界面改進(jìn)、自然語(yǔ)言處理技術(shù)集成、車輛診斷和維護(hù)建議、市場(chǎng)營(yíng)銷和客戶支持等多方面，以提高車輛性能和安全性，增

2023-10-27 20:05:02

182

知識(shí)圖譜與大模型結(jié)合方法概述

；3）LLM+KG協(xié)同使用，主要用于知識(shí)表示和推理兩個(gè)方面。該文綜述了以上三個(gè)路線的代表性研究，探討了未來(lái)可能的研究方向。知識(shí)圖譜（KG）和大語(yǔ)言模型（LLM）都是知識(shí)的表示

2023-10-29 15:50:01

530

Hugging Face LLM部署大語(yǔ)言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開源LLMs，比如BLOOM大型語(yǔ)言模型部署到亞馬遜云科技Amazon SageMaker進(jìn)行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

時(shí)間序列的基礎(chǔ)模型像自然語(yǔ)言處理那樣存在嗎

時(shí)間序列預(yù)測(cè)領(lǐng)域在最近的幾年有著快速的發(fā)展，比如N-BEATS、N-HiTS、PatchTST和TimesNet。大型語(yǔ)言模型(LLM)最近在ChatGPT等應(yīng)用程序中變得非常流行，因?yàn)樗鼈兛梢?/div>

2023-11-03 10:15:22

279

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

的無(wú)限可能性。不同于其他嵌入式平臺(tái)，Jetson 能夠在本地運(yùn)行大語(yǔ)言模型（LLM）、視覺(jué) Transformer 和 stable diffusion，包括在 Jetson AGX Orin

2023-11-07 21:25:01

398

基于檢索的大語(yǔ)言模型簡(jiǎn)介

簡(jiǎn)介章節(jié)講的是比較基礎(chǔ)的，主要介紹了本次要介紹的概念，即檢索（Retrieval）和大語(yǔ)言模型（LLM）

2023-11-15 14:50:36

282

如何給OriginBot安裝大語(yǔ)言模型

包版本沖突，我沒(méi)有修復(fù)也能直接運(yùn)行，所以看起來(lái)問(wèn)題不大 ②安裝hobot-dnn sudo apt update sudo apt install -y tros-hobot-llm ③下載模型文件

2023-11-20 15:46:32

164

專欄發(fā)布 | LLM圈走馬換將？微軟廣告“黑五”來(lái)襲！

過(guò) 去一年并不平凡。從去年11月至今，LLM大型語(yǔ)言模型持續(xù)破圈、始終盤踞熱點(diǎn)話題之列。根據(jù)Adobe Analytics的最新在線購(gòu)物預(yù)測(cè)，感恩節(jié)本土市場(chǎng)假日季的在線收入，或?qū)⒂?/div>

2023-11-27 08:15:02

215

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語(yǔ)言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識(shí)庫(kù)、人機(jī)界面和動(dòng)態(tài)代理等不同領(lǐng)域。然而，存在一個(gè)普遍

2023-11-27 17:37:36

440

NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU 以及亞馬遜云科技的 EFA 來(lái)訓(xùn)練其最大的新一代大語(yǔ)言模型（LLM）。大語(yǔ)言模型的一切都很龐大——巨型模型是在數(shù)千顆 NVIDIA

2023-11-29 21:15:02

295

怎樣使用Accelerate庫(kù)在多GPU上進(jìn)行LLM推理呢？

大型語(yǔ)言模型(llm)已經(jīng)徹底改變了自然語(yǔ)言處理領(lǐng)域。隨著這些模型在規(guī)模和復(fù)雜性上的增長(zhǎng)，推理的計(jì)算需求也顯著增加。

2023-12-01 10:24:52

396

大語(yǔ)言模型簡(jiǎn)介：基于大語(yǔ)言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語(yǔ)言模型與生成式AI的全家桶：Bedrock對(duì)大語(yǔ)言模型進(jìn)行介紹。大語(yǔ)言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓(xùn)練語(yǔ)言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語(yǔ)言處理任務(wù)，如文本生成、機(jī)器翻譯和自然語(yǔ)言理解等。

2023-12-04 15:51:46

356

如何利用OpenVINO加速LangChain中LLM任務(wù)

LangChain 是一個(gè)高層級(jí)的開源的框架，從字面意義理解，LangChain 可以被用來(lái)構(gòu)建 “語(yǔ)言處理任務(wù)的鏈條”，它可以讓AI開發(fā)人員把大型語(yǔ)言模型（LLM）的能力和外部數(shù)據(jù)結(jié)合起來(lái)，從而

2023-12-05 09:58:14

325

全面解析大語(yǔ)言模型（LLM）

internal feedback：使用LLM去預(yù)測(cè)生成的plan取得成功的概率、Tree of Thought去對(duì)比不同的plan（有點(diǎn)類似AlphaGo的蒙特卡諾搜索的意思）、對(duì)中間結(jié)果進(jìn)行評(píng)估并作為長(zhǎng)期記憶存儲(chǔ)

2023-12-05 14:49:47

857

大規(guī)模語(yǔ)言模型的基本概念、發(fā)展歷程和構(gòu)建流程

大規(guī)模語(yǔ)言模型（Large Language Models，LLM），也稱大規(guī)模語(yǔ)言模型或大型語(yǔ)言模型，是一種由包含數(shù)百億以上參數(shù)的深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的語(yǔ)言模型，使用自監(jiān)督學(xué)習(xí)方法通過(guò)大量無(wú)標(biāo)注

2023-12-07 11:40:43

1141

大語(yǔ)言模型概述

的人工智能模型，旨在理解和生成自然語(yǔ)言文本。這類模型的核心是深度神經(jīng)網(wǎng)絡(luò)，通過(guò)大規(guī)模的訓(xùn)練數(shù)據(jù)和強(qiáng)大的計(jì)算能力，使得模型能夠?qū)W習(xí)到語(yǔ)言的語(yǔ)法、語(yǔ)境和語(yǔ)義等多層次的信息。大語(yǔ)言模型的發(fā)展歷史可以追溯到深度學(xué)習(xí)的

2023-12-21 17:53:59

555

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個(gè)概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語(yǔ)言的基本單位，中文一般是詞或字（其實(shí)字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個(gè)調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當(dāng)，甚至更好。

2023-12-26 14:23:16

247

大語(yǔ)言模型使用指南

，帶你發(fā)現(xiàn)大語(yǔ)言模型的潛力，解鎖無(wú)限可能。揭秘大語(yǔ)言模型的魔法在動(dòng)手操作之前，我們先來(lái)揭秘一下大語(yǔ)言模型的魔法。這些模型通過(guò)大量的文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，使其具備了超強(qiáng)的理解和生成自然語(yǔ)言的能力。搞懂它的構(gòu)造和培訓(xùn)過(guò)程

2023-12-29 14:18:59

276

2023年大語(yǔ)言模型(LLM)全面調(diào)研：原理、進(jìn)展、領(lǐng)跑者、挑戰(zhàn)、趨勢(shì)

大型語(yǔ)言模型(LLM)是基于人工智能的先進(jìn)模型，經(jīng)過(guò)訓(xùn)練，它可以密切反映人類自然交流的方式處理和生成人類語(yǔ)言。這些模型利用深度學(xué)習(xí)技術(shù)和大量訓(xùn)練數(shù)據(jù)來(lái)全面理解語(yǔ)言結(jié)構(gòu)、語(yǔ)法、上下文和語(yǔ)義。

2024-01-03 16:05:25

441

美國(guó)防部生成式人工智能先期發(fā)展動(dòng)向分析

生成式人工智能（AI）能力，如大型語(yǔ)言模型（LLM）在全球的受歡迎程度、能力和影響力都在不斷增長(zhǎng)。這些能力是在大規(guī)模數(shù)據(jù)集上訓(xùn)練的，以便生成細(xì)節(jié)和明顯連貫的內(nèi)容，這在以前需要人類創(chuàng)作。這些能力帶來(lái)了新的機(jī)遇，同時(shí)也帶來(lái)了新的重大風(fēng)險(xiǎn)。

2024-01-03 16:30:55

638

大語(yǔ)言模型推斷中的批處理效應(yīng)

隨著開源預(yù)訓(xùn)練大型語(yǔ)言模型（Large Language Model, LLM ）變得更加強(qiáng)大和開放，越來(lái)越多的開發(fā)者將大語(yǔ)言模型納入到他們的項(xiàng)目中。其中一個(gè)關(guān)鍵的適應(yīng)步驟是將領(lǐng)域特定的文檔集成到預(yù)訓(xùn)練模型中，這被稱為微調(diào)。

2024-01-04 12:32:39

228

模型與人類的注意力視角下參數(shù)規(guī)模擴(kuò)大與指令微調(diào)對(duì)模型語(yǔ)言理解的作用

近期的大語(yǔ)言模型（LLM）在自然語(yǔ)言理解和生成上展現(xiàn)出了接近人類的強(qiáng)大能力，遠(yuǎn)遠(yuǎn)優(yōu)于先前的BERT等預(yù)訓(xùn)練模型（PLM）。

2024-01-04 14:06:39

139

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實(shí)現(xiàn)前端低功耗生成式 AI。

2024-01-09 15:19:33

597

安霸發(fā)布全新N1系列生成式AI芯片

安霸在CES 2024上發(fā)布了全新的N1系列生成式AI芯片，這是一款專門為前端設(shè)備設(shè)計(jì)的芯片，支持本地運(yùn)行大型語(yǔ)言模型（LLM）應(yīng)用。其單顆SoC能夠支持1至340億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，從而實(shí)現(xiàn)低功耗的生成式AI功能。

2024-01-09 15:32:54

602

2023年LLM大模型研究進(jìn)展

作為做LLM應(yīng)用的副產(chǎn)品，我們提出了RLCD[11]，通過(guò)同時(shí)使用正例和負(fù)例prompt，自動(dòng)生成帶標(biāo)簽的生成樣本不需人工標(biāo)注，然后可以接大模型微調(diào)，或者用于訓(xùn)練reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推測(cè)解碼（Speculative Decoding）最新綜述

這個(gè)問(wèn)題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個(gè)解碼步只能生成一個(gè)token。這導(dǎo)致GPU計(jì)算資源利用率

2024-01-29 15:54:24

261

單芯片沒(méi)有神經(jīng)網(wǎng)絡(luò)加速器NPU可以玩微型AI應(yīng)用嗎？

講到AI相信大家第一時(shí)間多半是聯(lián)想到大型語(yǔ)言模型(LLM)和生成式AI(genAI, AIGC)應(yīng)用，可以對(duì)話聊天、查詢數(shù)據(jù)、生成文章圖像和音樂(lè)，而這些應(yīng)用多半需要用到極大的云端算力才能完成。

2024-02-20 16:40:33

214

小白學(xué)大模型：什么是生成式人工智能？

和軟件，我將這些程序簡(jiǎn)稱為“GAIs”。革命開始第一波GAIs主要致力于進(jìn)行自然語(yǔ)言對(duì)話。被稱為“大型語(yǔ)言模型”（LLMs）的這些模型已經(jīng)展示出在各種任務(wù)上超凡的表

2024-02-22 08:27:58

239

100%在樹莓派上執(zhí)行的LLM項(xiàng)目

ChatGPT的人性口語(yǔ)化回復(fù)相信許多人已體驗(yàn)過(guò)，也因此掀起一波大型語(yǔ)言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

OpenVINO?助力谷歌大語(yǔ)言模型Gemma實(shí)現(xiàn)高速智能推理

大型語(yǔ)言模型（LLM）正在迅速發(fā)展，變得更加強(qiáng)大和高效，使人們能夠在廣泛的應(yīng)用程序中越來(lái)越復(fù)雜地理解和生成類人文本。

2024-03-17 17:17:08

504

已全部加載完成

搜索歷史

Medusa如何加速大型語(yǔ)言模型（LLM）的生成？

評(píng)論