LLM真的能推理和規(guī)劃嗎？

【導(dǎo)讀】前段時間，LeCun轉(zhuǎn)發(fā)了2篇長文，集中討論了LLM的規(guī)劃推理能力和涌現(xiàn)能力的來源。作者認(rèn)為，LLM本身不具有規(guī)劃推理能力，而涌現(xiàn)出來的能力，根源應(yīng)該都是上下文學(xué)習(xí)的結(jié)果。

大語言模型到底會不會推理？涌現(xiàn)出來的各種能力到底來源是什么？

前段時間，LeCun在自己推特上轉(zhuǎn)發(fā)了好幾篇文章，集中討論了這個問題：

「自回歸LLM無法制定計劃（并且無法真正推理）」。

而LeCun轉(zhuǎn)發(fā)第二篇論文，則討論了LLM涌現(xiàn)能力。

原推表示，不管大伙相不相信LLM的涌現(xiàn)能力，這篇文章都值得一讀：

「經(jīng)過了超過1000次的系列實(shí)驗(yàn)，我們證明了大語言模型所謂的涌現(xiàn)能力，其實(shí)僅僅是上下文學(xué)習(xí)而已?！?/p>

LLM真的能推理和規(guī)劃嗎？

Subbarao Kambhampat的文章認(rèn)為，網(wǎng)上對于LLM能夠推理和規(guī)劃的說法，本身不太站得住腳，但是學(xué)界對于這個問題，也開始進(jìn)行了很嚴(yán)肅地研究。

至少以他之前針對GPT-3的研究看來，認(rèn)為大語言模型行能夠推理和規(guī)劃的說法是有很大問題的。

https://arxiv.org/pdf/2206.10498.pdf

我們提出了一個可擴(kuò)展的評估框架來測試LLM推理行動和變化的能力，這是人類智力的一個核心方面。我們提供了多個測試用例，這些測試用例比之前建立的任何基準(zhǔn)都更加復(fù)雜，并且每個測試用例都會評估有關(guān)操作和更改的推理的不同方面。GPT-3 (davinci)、Instruct-GPT-3 (text-davinci-002) 和 BLOOM (176B) 的結(jié)果顯示此類推理任務(wù)的表現(xiàn)不佳。

針對新推出的GPT-4，教授的團(tuán)隊也將之前的研究進(jìn)行了進(jìn)一步的拓展，試圖發(fā)現(xiàn)新的最先進(jìn)的大語言模型是否對于推理和規(guī)劃能力有了新的進(jìn)展。

https://arxiv.org/pdf/2206.10498.pdf

我們通過在類似于國際規(guī)劃競賽中使用的方式，生成一組實(shí)例來進(jìn)行系統(tǒng)研究，并以兩種不同的模式評估LLM：自主模式和啟發(fā)式模式。我們的研究結(jié)果表明，法學(xué)碩士自主生成可執(zhí)行計劃的能力相當(dāng)有限，GPT-4在各個領(lǐng)域的平均成功率為～12%。

然而，啟發(fā)式模式的結(jié)果顯示出更多的希望。在啟發(fā)式模式中，我們證明了LLM生成的計劃可以改進(jìn)底層合理規(guī)劃器的搜索過程，并且還表明外部驗(yàn)證者可以幫助提供對生成的計劃的反饋，并反向提示 LLM 以更好地生成計劃。

文章用一張很有意思的圖向讀者說明，似乎LLM表現(xiàn)出來的推理能力，主要的原因還是在于任務(wù)比較簡單，提問題的人已經(jīng)知道了問題的答案。

而針對競賽級別的規(guī)劃和推理任務(wù)，比如國際規(guī)劃大賽（IPC）中的積木世界（Blocks World）問題，LLM的表現(xiàn)就不盡如人意。

初步結(jié)果表明，從GPT-3到GPT3.5再到GPT-4，生成的平面圖的精度有一定的提高，GPT-4在Blocks World中達(dá)到30%的經(jīng)驗(yàn)精度（empirical accuracy）(盡管在其他領(lǐng)域仍然較低)。

教授的研究團(tuán)隊認(rèn)為，對于很多規(guī)劃任務(wù)的表現(xiàn)，LLM的能力可能只是因?yàn)樗谔貏e大的范圍內(nèi)進(jìn)行了訓(xùn)練，從而「記住」規(guī)劃的內(nèi)容。

于是研究團(tuán)隊通過混淆規(guī)劃問題中的動作和對象的名稱來降低近似檢索的有效性，阻止大語言模型檢索自己記住的「規(guī)劃內(nèi)容」。

在這樣的挑戰(zhàn)面前，GPT-4的經(jīng)驗(yàn)表現(xiàn)急劇下降。

對于LLM不能直接自主地進(jìn)行規(guī)劃的局限，研究團(tuán)隊通過兩種方式進(jìn)行改進(jìn)：

首先是對模型進(jìn)行微調(diào)，不過教授的團(tuán)隊在對模型進(jìn)行了微調(diào)之后，還是沒有發(fā)現(xiàn)模型的規(guī)劃能力有提升。

而且認(rèn)為，即便通過微調(diào)模型使得模型的規(guī)劃能力提高了，但是也是將規(guī)劃任務(wù)轉(zhuǎn)化為基于內(nèi)存的檢索，而不能證明大語言模型能夠進(jìn)行自主規(guī)劃。

第二種提高模型規(guī)劃能力的方法是不斷提示LLM，改進(jìn)它初始的計劃。

但是對于這種方法，特別是不斷讓模型自己生成改進(jìn)意見的提示，本質(zhì)上都是讓模型生成猜測，或者是提示的人決定哪些猜測能更好地改進(jìn)規(guī)劃，都不是模型自己提升了計劃能力。

那些頂會上聲稱展示了LLM規(guī)劃能力的論文問題出在哪里？

持懷疑態(tài)度的讀者現(xiàn)在可能會問，但那些在高調(diào)的人工智能會議上聲稱展示了LLM規(guī)劃能力的論文是怎么回事？

要分析這些說法，首先需要明白，解決規(guī)劃任務(wù)需要：

1. 擁有必要的規(guī)劃領(lǐng)域知識

2. 能夠?qū)⑦@些計劃知識組裝成一個可執(zhí)行的計劃，該計劃負(fù)責(zé)完成子目標(biāo)，或者進(jìn)行資源交互。

第一個要素可以稱為知識獲取，第二個要素可以稱為推理/計劃。

許多聲稱LLM具有規(guī)劃能力的論文，在仔細(xì)檢查后，都混淆了從LLM中提取的可執(zhí)行計劃的一般規(guī)劃知識。

如果研究人員所尋找的都是抽象的計劃，例如「婚禮計劃」，而沒有實(shí)際執(zhí)行計劃的意圖時，很容易將它們與完整的可執(zhí)行計劃混淆，從而沒法準(zhǔn)確地評估LLM的計劃能力。

教授團(tuán)隊對幾篇聲稱LLM具有規(guī)劃能力的論文的仔細(xì)研究后發(fā)現(xiàn)，LLM要么在子目標(biāo)交互可以被安全地忽略的領(lǐng)域/任務(wù)中進(jìn)行計劃工作（規(guī)劃沒有意義的任務(wù)或者不重要的任務(wù)），要么將推理問題委托給循環(huán)過程中的人類來完成(通過反復(fù)提示，「糾正」計劃)。

如果沒有這些假設(shè)或者緩沖措施，從LLM中得出的計劃在外行用戶看來可能是合理的，但會導(dǎo)致執(zhí)行時出現(xiàn)各種各樣的問題。

比如，旅行計劃書籍的大量出現(xiàn)，這些書籍內(nèi)容基本都是由LLM自動生成出來的，而購買這些書籍的讀者卻把它們誤認(rèn)為是可以執(zhí)行的計劃，最后會導(dǎo)致結(jié)果非常令讀者失望。

LLM并不存在計劃和推理能力

總而言之，教授認(rèn)為，他所讀過、驗(yàn)證過或做過的任何事情都沒有給他任何令人信服的理由，讓他相信LLM會像通常理解的那樣進(jìn)行推理/計劃。

認(rèn)為LLM具有推理/規(guī)劃能力的研究所做的內(nèi)容，在大規(guī)模的訓(xùn)練下，其實(shí)都相當(dāng)于是檢索，有時會被誤認(rèn)為是推理能力。

LLM確實(shí)擅長為任何任務(wù)產(chǎn)生想法，包括那些涉及推理的任務(wù)，這可以有效地用于支持推理/計劃。?換句話說，LLM已經(jīng)擁有足夠驚人的近似檢索的能力，我們可以充分利用這種能力，不需要將虛假的推理/計劃能力歸在LLM身上。

如果對于這個問題感興趣，還可以參考教授的一場演講。

而另一篇關(guān)于大語言模型涌現(xiàn)的能力的文章，針對的是上下文學(xué)習(xí)的能力。

涌現(xiàn)能力？不存在！

https://arxiv.org/pdf/2309.01809.pdf

簡單來說，研究人員發(fā)現(xiàn)，LLM在執(zhí)行一些沒有經(jīng)過明確訓(xùn)練的、且需要復(fù)雜推理能力的任務(wù)時，表現(xiàn)不是一般的好。

這種能力對未來NLP的研究方向產(chǎn)生了重大影響。隨著LLMs的不斷壯大，在可預(yù)見的未來，應(yīng)用的場合會越來越普遍。

但問題在于，在研究人員評估LLMs的能力時，會被一些因素所干擾，導(dǎo)致混淆。

比方說，有些能力可能是由prompt技術(shù)帶來的。上下文學(xué)習(xí)（in-context learning）和指令跟隨（instruction following）都是其中的例子。

這些情況也會隨著模型規(guī)模的不斷變大而增多。

因此，本文的研究團(tuán)隊全面考察了這些能力，考慮到了一些可能影響模型評估的潛在偏差因素。

研究人員對一組18個模型進(jìn)行了嚴(yán)密的測試，這些LLM的參數(shù)范圍從6000萬到1750億不等，測試包含22項任務(wù)。

在經(jīng)過了1000多次實(shí)驗(yàn)后，研究人員給出了充足的證據(jù)，證明了所謂的涌現(xiàn)能力，主要就是上下文學(xué)習(xí)帶來的。

研究人員還表示，并沒有找到能證明LLM有推理能力的證據(jù)。

實(shí)驗(yàn)方法

具體來看，研究人員逐一研究了以下問題：

·為了消除上下文學(xué)習(xí)和指令微調(diào)可能會帶來的影響，研究人員選擇了零樣本條件，并使用了非指令微調(diào)的模型。

·探究上下文學(xué)習(xí)能力和指令微調(diào)之間的相互作用，搞明白是不是該用推理能力來解釋指令微調(diào)模型的一些額外能力。為此，研究人員比較了沒有指令微調(diào)的模型和在不同程度上經(jīng)過指令微調(diào)的不同規(guī)模模型的能力。

·通過人工來檢查LLM的功能性語言能力、形式語言能力，以及是否可以記住任務(wù)。

為了評估LLMs能力的真實(shí)程度，研究人員精心設(shè)計了實(shí)驗(yàn)結(jié)構(gòu)，盡可能減少誤導(dǎo)因素。

此外，該團(tuán)隊的實(shí)驗(yàn)設(shè)計特別注重不能觸發(fā)模型的上下文學(xué)習(xí)能力。比如，指令微調(diào)會將訓(xùn)練模型的指令轉(zhuǎn)化為示例（exemplar），這就可能導(dǎo)致上下文學(xué)習(xí)。

因此，實(shí)驗(yàn)團(tuán)隊使用了非指令微調(diào)的模型來避免這種可能。

下圖是研究人員所選用的模型。

研究人員對來自四個模型系列的一些不同規(guī)模的模型進(jìn)行了評估，包括GPT、T5、Falcon和LLaMA。

之所以選擇這些模型，是因?yàn)镚PT和LLaMA之前就被發(fā)現(xiàn)有涌現(xiàn)能力，而Falcon處于LLM排行榜的前列。

研究人員還選擇了T5，因?yàn)樗且粋€編碼器——解碼器模型（encoder-decoder model），其指令微調(diào)版本（Flan）是使用大量指令微調(diào)數(shù)據(jù)集訓(xùn)練出來的。

而在GPT系列中，研究人員使用了GPT-2和GPT-3的指令微調(diào)和非指令微調(diào)版本；在T5系列中，研究人員使用了T5及其指令微調(diào)的對應(yīng)版本FLAN-T5。

同樣，研究人員使用了Falcon3的指令微調(diào)版本和非指令微調(diào)版本。至于LLaMA，由于它沒有經(jīng)過指令微調(diào)，研究人員無法獲得該模型的指令微調(diào)版本。

此外，研究人員還評估了GPT-3 text-davinci-003，這是一個InstructGPT模型。InstructGPT模型最初是根據(jù)注釋者編寫的prompt和相應(yīng)的預(yù)期行為進(jìn)行微調(diào)的，然后再使用該模型收集其它模型輸出的排序數(shù)據(jù)集，利用人類反饋強(qiáng)化學(xué)習(xí)（RLHF）對其進(jìn)行進(jìn)一步微調(diào)。

事實(shí)證明，這種訓(xùn)練方法可以提高模型的性能。

其中，研究人員選的T5模型特意低于1B的參數(shù)量，因?yàn)樵谶@么小的模型中還沒有觀察到涌現(xiàn)能力，這在研究人員的實(shí)驗(yàn)中起到了關(guān)鍵的控制作用。

在研究人員選擇的模型中，GPT-3 davinci（非指令微調(diào)）、GPT-3 textdavinci-001（指令微調(diào)）和GPT-3 textdavinci-003（InstructGPT）都是以前觀察到過涌現(xiàn)能力的模型。這一選擇主要是出于模型可用性的考慮。

其它已證明具有涌現(xiàn)能力的模型系列包括PaLM、Chinchilla、Gopher和LaMDA，但由于沒有相應(yīng)的應(yīng)用程序接口，所以研究人員沒有對其進(jìn)行評估。

上圖為實(shí)驗(yàn)中使用的任務(wù)清單，以及這些任務(wù)在之前是否被識別為涌現(xiàn)的情況，并附有解決任務(wù)所需能力的性質(zhì)分類。

這種分類是通過人工檢查數(shù)據(jù)，并采用Mahowald等人提供的分類框架確定。研究人員評估了每個任務(wù)中50個示例的記憶情況，假定任務(wù)數(shù)據(jù)沒有泄露。

上表詳細(xì)列出了整體的實(shí)驗(yàn)設(shè)置，包括測試的不同模型、實(shí)驗(yàn)中使用的不同任務(wù)以及采用的評估設(shè)置。

鑒于團(tuán)隊的目標(biāo)是評估不受其他因素影響的LLM的涌現(xiàn)能力，研究人員對從T5和GPT系列中選出的12個模型中的每個模型在所有22個選定任務(wù)上進(jìn)行了評估。

對于每種情況，研究人員都采用了相同的prompt策略：封閉式和封閉式對抗。為考慮反應(yīng)的可變性，研究人員將每個實(shí)驗(yàn)進(jìn)行三次，計算平均結(jié)果。其中運(yùn)行的所有實(shí)驗(yàn)都是在英偉達(dá)A100 GPU上進(jìn)行的，溫度為0.01，批量大小為16。

對于GPT-3 175B參數(shù)模型（davinci、text-davinci-001 和 text-davinci003），團(tuán)隊使用官方的API進(jìn)行評估，只進(jìn)行一次，溫度為0。這是因?yàn)楸疚牡难芯咳藛T也將溫度設(shè)為了0，保證了結(jié)果的可重復(fù)性，并將出現(xiàn)幻覺的可能性降至最低。

此外，他們還從LLaMA和Falcon系列中選擇了六個模型，在前面選擇的22個任務(wù)中的4個上進(jìn)行了評估。

研究人員在選擇這4個任務(wù)時，要確保其中兩個任務(wù)先前已被確定為突發(fā)任務(wù)，另外兩個任務(wù)已被確定為非突發(fā)任務(wù)。之后，團(tuán)隊再次使用封閉式和對抗式的prompt策略對它們進(jìn)行了測試，并對每個實(shí)驗(yàn)運(yùn)行三次以考慮到可能存在的差異。

鑒于某些評估任務(wù)的相關(guān)選項數(shù)量不固定，研究人員通過多次隨機(jī)選擇該任務(wù)中的問題選項并求得平均分，來構(gòu)建每項任務(wù)的基線。

實(shí)驗(yàn)結(jié)果

對于第一個研究問題：?鑒于上下文學(xué)習(xí)對LLMs中涌現(xiàn)能力存在一定的潛在影響，在沒有上下文學(xué)習(xí)（包括指令微調(diào)）的情況下，哪些能力是真正的涌現(xiàn)能力？

研究團(tuán)隊首先展示了在零樣本條件下未經(jīng)指令微調(diào)的175B參數(shù)的GPT-3模型的表現(xiàn)。

上圖是在封閉式prompt策略下，GPT系列模型在各種任務(wù)上的表現(xiàn)。

研究團(tuán)隊使用的是BERTScore精確度 (BSA) 和匹配精確度 (EMA)，在少樣本 (FS)、零樣本 (ZS) 設(shè)置下對指令調(diào)整（IT）模型和非指令調(diào)整（non-IT）模型進(jìn)行了評估。

藍(lán)色表示指令微調(diào)模型在少樣本條件下的結(jié)果，與之前文獻(xiàn)報道的結(jié)果相當(dāng)。

黃色表示在相同設(shè)置下使用BSA測得的性能，紅色表示在非指令微調(diào)模型的零樣本條件下的BSA結(jié)果，換句話說，這種條件就代表著沒有上下文學(xué)習(xí)的影響下的結(jié)果。

上圖為Falcon（上部）和LLaMA（下部）模型在非指令調(diào)整零樣本條件下對所選任務(wù)子集的性能表現(xiàn)示意圖，表明在沒有上下文學(xué)習(xí)的情況下，模型始終缺乏所謂的涌現(xiàn)能力。

上圖為非指令微調(diào)的GPT模型在對抗環(huán)境下的表現(xiàn)，在這些任務(wù)子集上，GPT的表現(xiàn)高于隨機(jī)基線。在一些任務(wù)上的表現(xiàn)是可預(yù)測的，因此不算是涌現(xiàn)能力。

在其余任務(wù)中，與隨機(jī)基線相比，成績的提高幅度相對較小。

而針對第二個問題：經(jīng)過指令微調(diào)的模型是否表現(xiàn)出了推理能力，還是說指令微整更有可能使這些模型更有效、更高效地進(jìn)行上下文學(xué)習(xí)？

需要注意的是，指令微調(diào)的本質(zhì)是在指令和范例之間建立映射關(guān)系，而這正是上下文學(xué)習(xí)的特征，因此這一過程很可能確實(shí)觸發(fā)了上下文學(xué)習(xí)。

研究人員的假設(shè)意味著，指令微調(diào)為LLMs提供了將指令轉(zhuǎn)化為范例的能力，而范例隨后又調(diào)動了它們的上下文學(xué)習(xí)能力。

下圖是T5系列模型在不同環(huán)境下的性能表現(xiàn)。

審核編輯：黃飛

閱讀全文

解碼器(40056) 解碼器(40056)
編碼器(131226) 編碼器(131226)
GPT(14803) GPT(14803)
大模型(810) 大模型(810)

對比解碼在LLM上的應(yīng)用

為了改進(jìn)LLM的推理能力，University of California聯(lián)合Meta AI實(shí)驗(yàn)室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實(shí)驗(yàn)表明，所提方法能有效改進(jìn)LLM的推理能力。讓我們走進(jìn)論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運(yùn)行l(wèi)lama

TensorRT-LLM正式出來有半個月了，一直沒有時間玩，周末趁著有時間跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度預(yù)測方案

本文假設(shè)不同的ICL為LLM提供了關(guān)于任務(wù)的不同知識，導(dǎo)致對相同數(shù)據(jù)的不同理解和預(yù)測。因此，一個直接的研究問題出現(xiàn)了:llm能否用多個ICL提示輸入來增強(qiáng)，以提供最可信的預(yù)測？為解決這個問題，本文提出上下文采樣(ICS)。ICS遵循三步流程:采樣、增強(qiáng)和驗(yàn)證，如圖1所示。

2023-11-24 11:20:46

863

低比特量化技術(shù)如何幫助LLM提升性能

針對大語言模型 (LLM) 在部署過程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

使用基于Transformers的API在CPU上實(shí)現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個創(chuàng)新工具包，可基于英特爾架構(gòu)平臺，尤其是第四代英特爾至強(qiáng) 可擴(kuò)展處理器（代號 SapphireRapids，SPR）顯著加速基于Transformers的大語言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM風(fēng)口背后，ChatGPT的成本問題

趁著ChatGPT這一熱門話題還未消退，我們來聊一聊這類大規(guī)模語言模型（LLM）或通用人工智能（AGI）背后的細(xì)節(jié)。畢竟目前相關(guān)的概念股跟風(fēng)大漲，但還是有不少人在持觀望態(tài)度。無論是國外還是國內(nèi)

2023-02-15 01:19:00

4129

用Chiplet解決ASIC在LLM上的成本問題

電子發(fā)燒友網(wǎng)報道（文/周凱揚(yáng)）雖說最近靠著GPT大語言模型的熱度，英偉達(dá)之類的主流GPU公司賺得盆滿缽滿，但要說仗著GPU的高性能就能高枕無憂的話，也就未免有些癡人說夢了。未來隨著LLM的繼續(xù)發(fā)展

2023-07-18 00:15:00

889

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

AscendCL快速入門——模型推理篇（上）

拿到？很遺憾，用上邊這兩個接口，我們是拿不到其指針的。其實(shí)也好理解，對于很多開發(fā)者來講，模型加載進(jìn)來之后，只要返回給開發(fā)者一個modelId，開發(fā)者能調(diào)用模型進(jìn)行推理就夠了，模型在內(nèi)存中存放在哪里并不

2023-08-24 11:04:14

C++演示中的推理速度比Python演示中的推理速度更快是為什么？

在同一主機(jī)機(jī)上采用相同型號的 Ran Object Detection C++ 演示和對象檢測 Python 演示。 C++ 演示中的推理速度比 Python 演示中的推理速度更快。

2023-08-15 06:52:29

DSP 速度曲線規(guī)劃電機(jī)

請教大家，如何做DSP 電機(jī)的速度曲線規(guī)劃？ eg：做一個梯形的速度曲線規(guī)劃，有一個先加速，再勻速，再減速的過程。程序上如何實(shí)現(xiàn)呢？已經(jīng)實(shí)現(xiàn)了位置環(huán)控制。本人想在位置環(huán)內(nèi)規(guī)劃速度曲線，使得它到位能夠準(zhǔn)確。

2016-04-25 18:04:35

Dllite_micro （輕量級的 AI 推理框架）

DLLite-Micro 是一個輕量級的 AI 推理框架，可以為 OpenHarmony OS 的輕量設(shè)備和小型設(shè)備提供深度模型的推理能力DLLite-Micro 向開發(fā)者提供清晰、易上手的北向接口

2021-08-05 11:40:11

HarmonyOS：使用MindSpore Lite引擎進(jìn)行模型推理

場景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設(shè)備 AI 模型推理的功能，目前已經(jīng)在圖像分類、目標(biāo)識別、人臉識別、文字識別等應(yīng)用中廣泛使用。本文介紹

2023-12-14 11:41:13

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的？基于RK33RK3399Pro怎樣使用NPU進(jìn)行加速推理呢？

2022-02-11 08:15:55

【飛凌RK3568開發(fā)板試用體驗(yàn)】RKNN模型推理測試

研的人工智能協(xié)處理器NPU，并且提供了RKNN-Toolkit。今天就介紹一下如何使用RKNN模型進(jìn)行推理應(yīng)用程序開發(fā)。一、推理應(yīng)用程序的基本流程RKNN 是瑞芯微（Rockchip） NPU平臺

2022-12-08 19:06:16

使用rk3588多npu推理模型，模型總推理時間還增加了，這怎么解釋

2023-11-05 18:22:42

充分利用Arm NN進(jìn)行GPU推理

Arm擁有跨所有處理器的計算IP。而且，無論您要在GPU，CPU還是NPU上進(jìn)行ML推理，都可以在一個通用框架下使用它們：Arm NN。Arm NN是適用于CPU，GPU和NPU的開源推理引擎。它

2022-04-11 17:33:06

分享一款能連Arduino仿真的電化學(xué)軟件

分享一款能連Arduino仿真的電化學(xué)軟件，能模擬多種檢測方法，適合仿真環(huán)境文件如下：

2018-03-23 15:00:30

分享一款能連arduino仿真的電化學(xué)軟件

分享一款能連arduino仿真的電化學(xué)軟件，能模擬多種檢測方法，適合仿真環(huán)境文件如下：

2023-10-10 06:52:48

壓縮模型會加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對推理時間沒有影響。aiRun 程序在 8

2023-01-29 06:24:08

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡要介紹

為提升識別準(zhǔn)確率，采用改進(jìn)神經(jīng)網(wǎng)絡(luò)，通過Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過程分為兩步：圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征，將數(shù)據(jù)處理成規(guī)范的格式，而改進(jìn)神經(jīng)網(wǎng)絡(luò)推理主要用于輸出結(jié)果。整個過程分為兩個步驟：圖像預(yù)處理和神經(jīng)網(wǎng)絡(luò)推理。需要提前安裝Tengine框架，

2021-12-23 08:07:33

在 ubuntu 上安裝騰訊推理框架 ncnn 的方法記錄

本教程詳細(xì)記錄了在 ubuntu 上安裝騰訊推理框架 ncnn 的方法。

2021-12-14 07:49:57

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何規(guī)劃PCB設(shè)計布線層數(shù)

　　有規(guī)劃的人生，會讓人感覺心里踏實(shí);自然，有規(guī)劃的設(shè)計，也是更讓人信服，layout工程師也可以少走彎路?！　“宓膶訑?shù)一般不會事先確定好，會由工程師綜合板子情況給出規(guī)劃，總層數(shù)由信號層數(shù)加上電源

2018-09-20 10:56:31

如何在OpenVINO工具包中使用帶推理引擎的blob？

無法確定如何在OpenVINO?工具包中使用帶推理引擎的 blob。

2023-08-15 07:17:58

如何提高YOLOv4模型的推理性能？

使用 PyTorch 對具有非方形圖像的 YOLOv4 模型進(jìn)行了訓(xùn)練。將權(quán)重轉(zhuǎn)換為 ONNX 文件，然后轉(zhuǎn)換為中間表示（IR）。無法確定如何獲得更好的推理性能。

2023-08-15 06:58:00

工程師喊話說：人生規(guī)劃，還不如把PCB設(shè)計布線層數(shù)規(guī)劃好！

2016年年尾敲響警鐘規(guī)劃這是一個在我們不同人生階段一直都狠刷存在感的詞匯。截止到目前為止都不能拋開它另存獨(dú)活高中的時候父母會問你報考什么大學(xué)大學(xué)的時候親朋好友會問你想從事什么工作工作之后HR會問你

2016-12-10 14:09:52

深度剖析OpenHarmony AI調(diào)度管理與推理接口

1 簡介AI任務(wù)管理與統(tǒng)一的推理能力提供了接口的統(tǒng)一標(biāo)準(zhǔn)系統(tǒng)上CPU提供了AI任務(wù)調(diào)度管理的能力，對AI的能力進(jìn)行了開放的推理和推理，同時，提供了一個不同的生命周期框架層級的應(yīng)用程序。推理接口

2022-03-25 11:15:36

用labview能實(shí)現(xiàn)挖掘機(jī)機(jī)器人的軌跡規(guī)劃嗎？

現(xiàn)在做畢業(yè)設(shè)計，是基于labview的挖掘機(jī)器人軌跡規(guī)劃與控制，就是用labview來實(shí)現(xiàn)軌跡規(guī)劃的編程，請教各位，這容易實(shí)現(xiàn)嗎？該從哪入手啊？謝謝了！

2013-04-01 14:32:01

請問TF卡真的能影響到USB驅(qū)動嗎？

我用金士頓的TF卡做系統(tǒng)盤就USB接口就可以用，用一個叫LD和諾的TF的時候USB口就不能用，同樣的鏡像，同樣的燒錄，同樣的板子，我想問下TF卡真的能影響到USB驅(qū)動嗎？

2019-09-26 23:03:19

請問一下rknn多圖推理參數(shù)該怎樣去設(shè)置呢

rknn多圖推理參數(shù)設(shè)置然后進(jìn)行推理，推理的結(jié)果會把三張圖片的結(jié)果合并在一個list中，需要我們自己將其分割開：最終其結(jié)果和單張推理的結(jié)果是相同的

2022-07-22 15:38:02

請問硬件仿真的速度能達(dá)到甚至超過軟件仿真的速度嗎？

我發(fā)現(xiàn)硬件仿真的速度一般要低于軟件仿真的速度，我想主要是因?yàn)閏ache miss引起的（在使能cache的情況下），請問，除了cache miss影響之外，還有哪些因素影響硬件仿真的速度，假若處理

2020-05-25 09:13:34

請問硬件仿真的速度能達(dá)到甚至超過軟件仿真的速度嗎？

我發(fā)現(xiàn)硬件仿真的速度一般要低于軟件仿真的速度，我想主要是因?yàn)閏ache miss引起的（在使能cache的情況下），請問，除了cache miss影響之外，還有哪些因素影響硬件仿真的速度，假若處理好的話有沒有可能硬件仿真速度大于軟件仿真速度？在硬件上需要注意哪些影響硬件仿真速度的關(guān)鍵因素？

2019-07-26 17:18:28

這個電路上芯片絲印字看不清已經(jīng)上電路圖請問能推理來嗎？

這個電路上芯片絲印字看不清請問能推理來嗎？整個圖

2022-05-08 23:23:59

基于事例推理的數(shù)字化城市規(guī)劃設(shè)計系統(tǒng)初探

摘要:結(jié)合數(shù)字化技術(shù)的發(fā)展，探討傳統(tǒng)城市規(guī)劃方法的數(shù)字化實(shí)現(xiàn).利用人工智能技術(shù)特別是基于事例推理(Case一Based Reasoning)技術(shù)，存貯和運(yùn)用專家的設(shè)計經(jīng)驗(yàn)來實(shí)現(xiàn)數(shù)字化城市規(guī)

2009-01-09 16:49:07

基于雙向混合推理機(jī)的知識庫系統(tǒng)

針對目前知識庫系統(tǒng)推理效率不高和信息可信度不強(qiáng)的特點(diǎn)，本文結(jié)合正向推理和反向推理的優(yōu)勢，取長補(bǔ)短，提出了一種雙向混合推理機(jī)。本文還設(shè)計了一個原型系統(tǒng)，采用知識

2010-07-26 17:57:06

第九講機(jī)器人軌跡規(guī)劃

本內(nèi)容是有關(guān)于工業(yè)機(jī)器人的軌跡規(guī)劃與計算推理過程。

2016-04-28 10:27:15

基于案例推理的高維解空間適應(yīng)性問題研究

利用案例推理對指揮實(shí)體任務(wù)規(guī)劃過程中決策問題求解方法的修正過程是該方法推理過程中最困難的階段，尤其當(dāng)決策問題解空間是多維的情況下。文章討論了指揮實(shí)體任務(wù)規(guī)劃過程中高維決策空間的修正問題，并提出了可行

2017-12-11 11:48:35

貝葉斯IP網(wǎng)絡(luò)擁塞鏈路推理

針對CLINK算法在路由改變時擁塞鏈路推理性能下降的問題，建立一種變結(jié)構(gòu)離散動態(tài)貝葉斯網(wǎng)模型，通過引入馬爾可夫性及時齊性假設(shè)簡化該模型，并基于簡化模型提出一種IP網(wǎng)絡(luò)擁塞鏈路推理算法（VSDDB

2018-01-16 18:46:26

怎么使用蒸餾法對低精度推理出浮點(diǎn)網(wǎng)絡(luò)進(jìn)行高保真的轉(zhuǎn)換？

神經(jīng)網(wǎng)絡(luò)加速器快速、低功耗推理的一個主要挑戰(zhàn)是模型的大小。近年來，隨著模型尺寸的增加，推理時間和每次推理能耗的相應(yīng)增加，神經(jīng)網(wǎng)絡(luò)向更深的神經(jīng)網(wǎng)絡(luò)發(fā)展，激活和系數(shù)也在增加。這在資源受限的移動和汽車

2021-06-19 14:42:16

1399

NVIDIA發(fā)布Riva語音AI和大型LLM軟件

　　它包括Megatron方面的進(jìn)步，這是一個由 NVIDIA 研究人員領(lǐng)導(dǎo)的開源項目，旨在開發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ，如 Megatron 530B ，并使用 NVIDIA Triton 推理服務(wù)器跨多個 GPU 和節(jié)點(diǎn)進(jìn)行部署。

2022-04-01 16:27:36

10987

如何使用Triton進(jìn)行高效的推理部署

一個完整的醫(yī)療影像推理流程一般包含數(shù)據(jù)的前處理、AI 推理以及數(shù)據(jù)后處理這幾部分。

2022-04-10 15:06:09

2396

基于e-CARE的因果推理相關(guān)任務(wù)

因果推理是人類的一項核心認(rèn)知能力。借助因果推理能力，人類得以理解已觀測到的各種現(xiàn)象，并預(yù)測將來可能發(fā)生的事件。然而，盡管當(dāng)下的各類因果推理模型已經(jīng)在現(xiàn)有的因果推理數(shù)據(jù)集上取得了令人印象深刻的性能，然而，這些模型與人類的因果推理能力相比仍存在顯著差距。

2022-05-16 16:21:26

1081

使用多個推理芯片需要仔細(xì)規(guī)劃

過去兩年，推理芯片業(yè)務(wù)異常忙碌。有一段時間，似乎每隔一周就有另一家公司推出一種新的更好的解決方案。盡管所有這些創(chuàng)新都很棒，但問題是大多數(shù)公司不知道如何利用各種解決方案，因?yàn)樗麄儫o法判斷哪一個比另一個

2022-07-21 10:11:59

486

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強(qiáng)的通用知識理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究價值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態(tài)任務(wù)

本文整理了近兩年來基于LLM做vision-lanuage任務(wù)的一些工作，并將其劃分為4個類別：

2023-05-17 15:02:35

575

邱錫鵬團(tuán)隊提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語言模型（LLM）在各種自然語言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時，多模態(tài)大型語言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

417

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個關(guān)鍵。本文會涉及以下幾個問題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強(qiáng)的通用知識理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鑒于價格和質(zhì)量的廣泛差異，從業(yè)者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務(wù)中斷，則依賴單個 API 提供者是不可靠的，這可能發(fā)生在意外高需求的情況下。

2023-05-23 17:22:30

525

中國研究人員提出StructGPT，提高LLM對結(jié)構(gòu)化數(shù)據(jù)的零樣本推理能力

盡管結(jié)構(gòu)化數(shù)據(jù)的體量往往非常巨大，但不可能容納輸入提示中的所有數(shù)據(jù)記錄（例如，ChatGPT 的最大上下文長度為 4096）。將結(jié)構(gòu)化數(shù)據(jù)線性化為 LLM 可以輕松掌握的語句是解決此問題的簡單方法。工具操作技術(shù)激勵他們增強(qiáng) LLM 解決上述困難的能力。

2023-05-24 16:02:16

2156

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強(qiáng)大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)如何測試大語言模型(LLM)的純因果推理能力

? 因果推理是人類智力的標(biāo)志之一。因果關(guān)系NLP領(lǐng)域近年來引起了人們的極大興趣，但其主要依賴于從常識知識中發(fā)現(xiàn)因果關(guān)系。本研究提出了一個基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)來測試大語言模型(LLM

2023-06-20 15:39:05

1223

基于Transformer的大型語言模型（LLM）的內(nèi)部機(jī)制

工作原理變得越來越重要。更好地理解這些模型是如何做出決策的，這對改進(jìn)模型和減輕其故障（如幻覺或推理錯誤）至關(guān)重要。眾所周知，最近 LLM 成功的一個重要因素是它們能夠從上下文中學(xué)習(xí)和推理。LLM 對這些上下文的學(xué)習(xí)能力通常歸功于 Transformer 架構(gòu)，特別

2023-06-25 15:08:49

991

最新綜述！當(dāng)大型語言模型（LLM）遇上知識圖譜：兩大技術(shù)優(yōu)勢互補(bǔ)

LLM 是黑箱模型，缺乏可解釋性，因此備受批評。LLM 通過參數(shù)隱含地表示知識。因此，我們難以解釋和驗(yàn)證 LLM 獲得的知識。此外，LLM 是通過概率模型執(zhí)行推理，而這是一個非決斷性的過程。對于 LLM 用以得出預(yù)測結(jié)果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

適用于各種NLP任務(wù)的開源LLM的finetune教程~

ChatGLM2-6b是清華開源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào)，是目前社區(qū)非?；钴S的一個開源LLM。

2023-07-24 09:04:22

1311

LLM對程序員的沖擊和影響

LLM 對軟件研發(fā)的單點(diǎn)提效，我之前錄制過一段視頻，大家可以直接觀看，里面有詳細(xì)的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長度外推淺談

蘇神最早提出的擴(kuò)展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺的需求，然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經(jīng)支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

檢索增強(qiáng)LLM的方案全面的介紹

分分享了 ChatGPT 這類模型是如何一步一步訓(xùn)練的，后半部分主要分享了 LLM 模型的一些應(yīng)用方向，其中就對檢索增強(qiáng) LLM 這個應(yīng)用方向做了簡單介紹。

2023-09-08 16:39:55

799

從原理到代碼理解語言模型訓(xùn)練和推理，通俗易懂，快速修煉LLM

要理解大語言模型（LLM），首先要理解它的本質(zhì)，無論預(yù)訓(xùn)練、微調(diào)還是在推理階段，核心都是next token prediction，也就是以自回歸的方式從左到右逐步生成文本。

2023-09-19 16:25:47

519

mlc-llm對大模型推理的流程及優(yōu)化方案

比如RWKV和給定的device信息一起編譯為TVM中的runtime.Module（在linux上編譯的產(chǎn)物就是.so文件）提供mlc-llm的c++推理接口調(diào)用。

2023-09-26 12:25:55

383

Continuous Batching：解鎖LLM潛力！讓LLM推斷速度飆升23倍，降低延遲！

本文介紹一篇 LLM 推理加速技術(shù) 相關(guān)的文章，值得讀一讀。 LLMs 在現(xiàn)實(shí)應(yīng)用中的計算成本主要由服務(wù)成本所主導(dǎo)，但是傳統(tǒng)的批處理策略存在低效性。在這篇文章中，我們將告訴

2023-10-15 20:25:02

292

Nvidia 通過開源庫提升 LLM 推理性能

加利福尼亞州圣克拉拉——Nvidia通過一個名為TensorRT LLM的新開源軟件庫，將其H100、A100和L4 GPU的大型語言模型(LLM)推理性能提高了一倍。正如對相同硬件一輪又一輪改進(jìn)

2023-10-23 16:10:19

284

周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會，將幫助您了解 NVIDIA 開源大型語言模型（LLM）推理加速庫 TensorRT-LLM ?及其功能

2023-10-26 09:05:02

174

現(xiàn)已公開發(fā)布！歡迎使用 NVIDIA TensorRT-LLM 優(yōu)化大語言模型推理

NVIDIA 于 2023 年 10 月 19 日公開發(fā)布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優(yōu)化最新的大語言模型（Large Language Models）的推理

2023-10-27 20:05:02

478

Hugging Face LLM部署大語言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開源LLMs，比如BLOOM大型語言模型部署到亞馬遜云科技Amazon SageMaker進(jìn)行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

點(diǎn)亮未來：TensorRT-LLM 更新加速 AI 推理性能，支持在 RTX 驅(qū)動的 Windows PC 上運(yùn)行新模型

微軟 Ignite 2023 技術(shù)大會發(fā)布的新工具和資源包括 OpenAI?Chat?API 的 TensorRT-LLM 封裝接口、RTX 驅(qū)動的性能改進(jìn) DirectML?for?Llama

2023-11-16 21:15:03

408

使用MLC-LLM支持RWKV-5推理的過程思考

對LLM的理解比較有限，從代碼實(shí)現(xiàn)的角度來說，RWKV的狀態(tài)和KV Cache不同，不依賴序列長度，這讓RWKV模型在各種長度下運(yùn)行內(nèi)存和運(yùn)行速度都是趨于穩(wěn)定的，所以我感覺工程價值是比基于Transformer架構(gòu)比如Llama更好的，部署的性價比會天然更優(yōu)。

2023-11-19 15:58:57

502

LLM的幻覺問題最新綜述

幻覺被描述為無意義或不忠實(shí)于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺又進(jìn)一步分為內(nèi)在幻覺和外在幻覺。在LLMs中，幻覺的范圍包含了一個更廣泛、更全面的概念，主要集中在事實(shí)錯誤上。本文重新定義了幻覺的分類，為LLM應(yīng)用程序提供了一個更定制的框架。

2023-11-22 17:40:41

467

基于單一LLM的情感分析方法的局限性

LLM的發(fā)展為情感分析任務(wù)帶來的新的解決方案。有研究人員使用LLM，在上下文學(xué)習(xí)(in-context learning, ICL)的范式下，僅使用少量的訓(xùn)練示例就能夠?qū)崿F(xiàn)與監(jiān)督學(xué)習(xí)策略旗鼓相當(dāng)?shù)男阅鼙憩F(xiàn)。

2023-11-23 11:14:27

322

澎峰科技發(fā)布大模型推理引擎PerfXLLM

自從2020年6月OpenAI發(fā)布chatGPT之后，基于 Transformer 網(wǎng)絡(luò)結(jié)構(gòu)的語言大模型（LLM）引發(fā)了全世界的注意與追捧，成為了人工智能領(lǐng)域的里程碑事件。但大模型推理所需

2023-11-25 15:35:01

383

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識庫、人機(jī)界面和動態(tài)代理等不同領(lǐng)域。然而，存在一個普遍

2023-11-27 17:37:36

440

怎樣使用Accelerate庫在多GPU上進(jìn)行LLM推理呢？

大型語言模型(llm)已經(jīng)徹底改變了自然語言處理領(lǐng)域。隨著這些模型在規(guī)模和復(fù)雜性上的增長，推理的計算需求也顯著增加。

2023-12-01 10:24:52

396

用上這個工具包，大模型推理性能加速達(dá)40倍

作者：英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實(shí)現(xiàn)出色的LLM推理性能。英特爾 ?Extension for Transformer 創(chuàng)新

2023-12-01 20:40:03

552

如何利用OpenVINO加速LangChain中LLM任務(wù)

LangChain 是一個高層級的開源的框架，從字面意義理解，LangChain 可以被用來構(gòu)建 “語言處理任務(wù)的鏈條”，它可以讓AI開發(fā)人員把大型語言模型（LLM）的能力和外部數(shù)據(jù)結(jié)合起來，從而

2023-12-05 09:58:14

325

全面解析大語言模型（LLM）

internal feedback：使用LLM去預(yù)測生成的plan取得成功的概率、Tree of Thought去對比不同的plan（有點(diǎn)類似AlphaGo的蒙特卡諾搜索的意思）、對中間結(jié)果進(jìn)行評估并作為長期記憶存儲

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語言的基本單位，中文一般是詞或字（其實(shí)字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當(dāng)，甚至更好。

2023-12-26 14:23:16

247

ChatGPT是一個好的因果推理器嗎？

因果推理能力對于許多自然語言處理（NLP）應(yīng)用至關(guān)重要。最近的因果推理系統(tǒng)主要基于經(jīng)過微調(diào)的預(yù)訓(xùn)練語言模型（PLMs），如BERT [1] 和RoBERTa [2]。

2024-01-03 09:55:37

420

基于LLM的表格數(shù)據(jù)的大模型推理綜述

面向表格數(shù)據(jù)的推理任務(wù)，在計算機(jī)領(lǐng)域，特別是自然語言處理（Natural Language Processing，NLP）領(lǐng)域的研究中扮演著重要角色[1]。該任務(wù)要求模型在給定一個或多個表格的情況下，按照任務(wù)要求，生成相應(yīng)的結(jié)果作為答案（例如：表格問答、表格事實(shí)判斷）。

2024-01-08 09:56:14

357

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實(shí)現(xiàn)前端低功耗生成式 AI。

2024-01-09 15:19:33

597

LLM推理加速新范式！推測解碼（Speculative Decoding）最新綜述

這個問題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個解碼步只能生成一個token。這導(dǎo)致GPU計算資源利用率

2024-01-29 15:54:24

261

100%在樹莓派上執(zhí)行的LLM項目

ChatGPT的人性口語化回復(fù)相信許多人已體驗(yàn)過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

深度探討VLMs距離視覺演繹推理還有多遠(yuǎn)？

通用大型語言模型（LLM）推理基準(zhǔn)：研究者們介紹了多種基于文本的推理任務(wù)和基準(zhǔn)，用于評估LLMs在不同領(lǐng)域（如常識、數(shù)學(xué)推理、常識推理、事實(shí)推理和編程）的性能。這些研究包括BIG-bench、HELM、SuperGLUE和LAMA等。

2024-03-19 14:32:55

已全部加載完成

搜索歷史

LLM真的能推理和規(guī)劃嗎？

評論

LLM真的能推理和規(guī)劃嗎？