LLaMA生態(tài)中的各個(gè)模型梳理

最近大模型發(fā)展卷的很，王慧文都被整抑郁了。想要研究學(xué)習(xí)大模型，應(yīng)該從哪里開始呢？

目前大模型發(fā)展生態(tài)最好的當(dāng)屬M(fèi)eta的LLaMA模型。如果GPT系列是Windows操作系統(tǒng)(巧了，OpenAI的大東家目前就是微軟)，那么LLaMA就是Linux。如果GPT系列是蘋果手機(jī)，那么LLaMA就是安卓。如果你想基于大模型做一些事情，無論是創(chuàng)業(yè)還是研究，最好選擇一個(gè)生態(tài)好的模型，畢竟有人用才有市場。

ChatGPT演化的路徑如下圖所示。

圖片中分了4個(gè)階段，但是第三個(gè)和第四個(gè)階段一般都會放在一起，屬于對齊階段。所以一般會分成如下3個(gè)階段：

Stage 1: 預(yù)訓(xùn)練(Pretrain)

Stage 2: 監(jiān)督微調(diào)(SFT)

Stage 3: 對齊(Reward Model + RLHF)

既然已經(jīng)有了成功ChatGPT這一成功的案例，大家都想基于LLaMA把這條路再走一遍，以期望做出自己的ChatGPT。

所以基于LLaMA的模型雖然很多，但是基本都可以放到上面3個(gè)框架當(dāng)中。本文就沿著預(yù)訓(xùn)練、監(jiān)督微調(diào)、對齊(RW+RLHF)這一路徑來梳理一下LLaMA生態(tài)中的各個(gè)模型。

主要是點(diǎn)出這些模型處在大模型訓(xùn)練的那一個(gè)階段，以及都做了哪些創(chuàng)新性的工作，方便你根據(jù)自己的興趣和資源來選擇使用哪一個(gè)，對中文支持比較好的也都有注明。

Stage1 預(yù)訓(xùn)練: LLaMA 復(fù)現(xiàn)

RedPajama

參考LLaMA論文中的訓(xùn)練數(shù)據(jù)，收集并且開源可商用。

https://github.com/togethercomputer/RedPajama-Data

Baichuan-7B(支持中文)

采用LLaMA的相同架構(gòu)，在中文上做預(yù)訓(xùn)練。可商用。

王小川這次做大模型的切入點(diǎn)其實(shí)挺不錯(cuò)的，綁定到LLaMA的生態(tài)上，然后在中文上有所突破。可能也在構(gòu)思新三級火箭了吧。

目前Baichuan可以算是第一個(gè)LLaMA中文預(yù)訓(xùn)練模型，所以后面的工作都可以在這上面都走一遍，估計(jì)沒多久Baichuan-Alapca, Baichuan-Vicuna就都出來了。

https://github.com/baichuan-inc/baichuan-7B

OpenLLaMA

參考LLaMA的代碼，在Apache 2.0 license下的重新實(shí)現(xiàn)和訓(xùn)練。使用了RedPajama訓(xùn)練集合。

https://github.com/openlm-research/open_llama

Lit-LLaMA

參考LLaMA，在Apache 2.0 license下的只有代碼的重新實(shí)現(xiàn)。同時(shí)支持加載原始LLaMA和OpenLLaMA的權(quán)重。

https://github.com/Lightning-AI/lit-llama

Stage 2: 監(jiān)督微調(diào)

因?yàn)轭A(yù)訓(xùn)練模型本質(zhì)上還是個(gè)續(xù)寫模型，所以并不能很好的滿足人們的需求，所以監(jiān)督微調(diào)的作用就是微調(diào)模型產(chǎn)生理想的回復(fù)。

在監(jiān)督微調(diào)這里，大家目標(biāo)都是一樣的，但是做法有些不同，主要是有錢和沒錢的區(qū)別。

有錢你可以全參數(shù)微調(diào)，沒錢就只能使用一些低成本的方法，英文叫PEFT(Parameter-Efficient Fine-Tuning)。

PEFT確實(shí)是想我這種平民玩家的首選，但是有錢也可以用PEFT，它可以讓你微調(diào)更大的模型。比如我們就只能玩玩10B的，有點(diǎn)小錢用PEFT玩?zhèn)€幾十B的問題不大。

2.1 LLaMA + Instruction Finetuning(全量參數(shù))

Alpaca

llama7b + self-instruct數(shù)據(jù)指令微調(diào)。算是最早邁出LLaMA+SFT這一步的模型。最開始并沒有提供權(quán)重，后來通過diff的方式給出，需要LLaMA原始模型才能恢復(fù)，github上有教程。

當(dāng)時(shí)他們采用1張8卡A100(80G顯存)，52k的數(shù)據(jù)，訓(xùn)練了3個(gè)小時(shí)。訓(xùn)練成本大概是100刀。

https://github.com/tatsu-lab/stanford_alpaca

Alpaca衍生模型

BELLE(支持中文): 最早是基于BLOOM的，后來也支持LLaMA https://github.com/LianjiaTech/BELLE

openAlpaca: OpenLLaMA + databricks-dolly-15k dataset 進(jìn)行指令微調(diào) https://github.com/yxuansu/OpenAlpaca

gpt4-x-alpaca: 用GPT4的數(shù)據(jù)微調(diào)，數(shù)據(jù)集為GPTeacher https://huggingface.co/chavinlo/gpt4-x-alpaca

Vicuna

llama13b + ShareGPT對話數(shù)據(jù)，微調(diào)

研發(fā)團(tuán)隊(duì)基于Vicuna發(fā)布了FastChat對話機(jī)器人。

和Alpaca一樣，受協(xié)議限制，vicuna模型公布的權(quán)重也是個(gè)delta，每個(gè)參數(shù)要加上llama原來的權(quán)重才是模型權(quán)重。

https://github.com/lm-sys/FastChat

Vicuna衍生模型

gpt4-x-vicuna-13b: 用GPT4的數(shù)據(jù)微調(diào)，數(shù)據(jù)集為GPTeacher https://huggingface.co/NousResearch/gpt4-x-vicuna-13b

WizardLM

采用了Evol-Instruct來構(gòu)造指令，可以產(chǎn)生一些很難的指令.

深度演化包括五種操作：添加約束、深化、具體化、增加推理步驟并使輸入復(fù)雜化。

In-breadth Evolving 是突變，即根據(jù)給定的指令生成全新的指令

進(jìn)化是通過提示+LLM來實(shí)現(xiàn)的。

https://github.com/nlpxucan/WizardLM

TüLU

使用LLaMA + Human/GPT data mix 微調(diào)

驗(yàn)證了很多結(jié)論，論文值得一看。https://arxiv.org/abs/2306.04751

https://github.com/allenai/open-instruct

GPT4ALL

LLaMA用80w的GPT3.5的數(shù)據(jù)(code, story, conversation)微調(diào)而來。

https://github.com/nomic-ai/gpt4all

Koala

LLaMA13B基于ChatGPT Distillation Data和Open Source Data訓(xùn)練而來。

具體數(shù)據(jù)見下面：

https://bair.berkeley.edu/blog/2023/04/03/koala/

OpenBuddy(支持中文)

基于LLaMA，F(xiàn)alcon, OpenLLaMA微調(diào)的，只說用了對話數(shù)據(jù)，細(xì)節(jié)沒透漏。

https://github.com/OpenBuddy/OpenBuddy

Pygmalion 7B

給予LLaMA微調(diào)，使用了不同來源的56MB 的對話數(shù)據(jù)，包含了人工和機(jī)器。

https://huggingface.co/PygmalionAI/pygmalion-7b

2.2 LLaMA + PEFT

PEFT目前最流行的是LoRA，挺巧妙的架構(gòu)，可以看看https://arxiv.org/abs/2106.09685。

下面大多數(shù)的模型都是LLaMA+lora的架構(gòu)，不只是文本，AIGC的頭部網(wǎng)站civitai.com上很多模型也都是基于lora的。

最近還出了QLoRA，在LoRA的基礎(chǔ)上加入了量化，進(jìn)一步降低顯存的使用。https://arxiv.org/abs/2305.14314。

Baize

LLaMA + Lora

https://github.com/project-baize/baize-chatbot

LLaMA-Adapter

LLaMA + Adapter Layer

https://github.com/OpenGVLab/LLaMA-Adapter

CalderaAI/30B-Lazarus

似乎是多個(gè)LoRA的merge，但是沒太公布太多細(xì)節(jié)。

在huggingface的leaderboard上排名還挺靠前。

https://huggingface.co/CalderaAI/30B-Lazarus

Chinese-LLaMA-Alpaca(支持中文)

https://arxiv.org/pdf/2304.08177.pdf

LLaMA + 擴(kuò)詞表 + lora

Chinese LLaMA是屬于局部參數(shù)預(yù)訓(xùn)練

Stage1: frozen encoder，只用來訓(xùn)練Embedding層。

Stage2: 只訓(xùn)練Embedding, LM head, lora weights

在Chinese LLaMA的基礎(chǔ)上，仿照Alpaca訓(xùn)練了Chinese Alpaca

https://github.com/ymcui/Chinese-LLaMA-Alpaca

Chinese-Vicuna(支持中文)

基于：https://github.com/tloen/alpaca-lora

lora + 中文instruction數(shù)據(jù)

chatv1的數(shù)據(jù)使用了50k中文指令+對話混合數(shù)據(jù)。

并沒有擴(kuò)充詞表，據(jù)說Vicuna1.1并沒有擴(kuò)充詞表，但是中文效果不錯(cuò)。

https://github.com/Facico/Chinese-Vicuna

Stage 3: 對齊(LLaMA + FT + RHLF)

這部分可以說是把ChatGPT的路徑完整走了一遍。

StableVicuna

Vicuna = LLaMA + FT

StableVicuna = Vicuna + RLHF

https://github.com/Stability-AI/StableLM

StackLLaMA

SFT: LLaMA + Lora

RM: LLaMA + Lora + 分類

https://huggingface.co/blog/zh/stackllama

其他：LLaMA 推理優(yōu)化

llama.cpp

用C/C++實(shí)現(xiàn)的推理，不依賴顯卡。

https://github.com/ggerganov/llama.cpp

GPTQ-for-LLaMA

4 bits quantization of LLaMA using GPTQ.

https://github.com/qwopqwop200/GPTQ-for-LLaMa

進(jìn)NLP群—>加入NLP交流群

原文標(biāo)題：其他：LLaMA 推理優(yōu)化

文章出處：【微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

閱讀全文

機(jī)器人(200958) 機(jī)器人(200958)
WINDOWS(87074) WINDOWS(87074)
操作系統(tǒng)(121702) 操作系統(tǒng)(121702)
ChatGPT(3870) ChatGPT(3870)

技術(shù)與市場：AI大模型的“Linux時(shí)刻”降臨

LLaMA 包括四個(gè)不同的參數(shù)版本（70 億/130 億/330 億/650 億），不支持商用，指令數(shù) 據(jù)集基于 OpenAI，模型表現(xiàn)可與 GPT-3 持平或優(yōu)于 GPT-3。其中，70 億和 130 億參數(shù) 版擁有包含 1 萬億個(gè)標(biāo)識符（Token）的預(yù)訓(xùn)練數(shù)據(jù)集；

2023-06-01 16:43:10

1120

RISC -V跑大模型（一）

去年，ChatGPT的出現(xiàn)震驚了全世界，在短短幾個(gè)月的時(shí)間內(nèi)，ChatGPT的月活躍用戶達(dá)到了1億。ChatGPT的成功讓許多人第一次知道了大語言模型（Large Language Model

2023-07-17 15:13:29

412

RISC-V 跑大模型（二）：LLaMA零基礎(chǔ)移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環(huán)境里。

2023-07-17 16:16:20

917

RISC-V 跑大模型（三）：LLaMA中文擴(kuò)展

這是RISC-V跑大模型系列的第三篇文章，前面我們?yōu)榇蠹医榻B了如何在RISC-V下運(yùn)行LLaMA，本篇我們將會介紹如何為LLaMA提供中文支持。

2023-07-17 17:15:47

495

英特爾一系列AI解決方案，為Llama 2大模型提供實(shí)力之選

英特爾廣泛的AI硬件組合及開放的軟件環(huán)境，為Meta發(fā)布的Llama 2模型提供了極具競爭力的選擇，進(jìn)一步助力大語言模型的普及，推動AI發(fā)展惠及各行各業(yè)。 ? 大語言模型（LLM）在生成文本、總結(jié)

2023-07-25 09:56:26

736

基于Llama2和OpenVIN打造聊天機(jī)器人

Llama 2是 Meta 發(fā)布了其最新的大型語言模型，Llama2 是基于 Transformer 的人工神經(jīng)網(wǎng)絡(luò)，以一系列單詞作為輸入，遞歸地預(yù)測下一個(gè)單詞來生成文本。

2023-08-06 11:06:30

523

llama.cpp代碼結(jié)構(gòu)&調(diào)用流程分析

llama.cpp 的代碼結(jié)構(gòu)比較直觀，如下所示，為整體代碼結(jié)構(gòu)中的比較核心的部分的代碼結(jié)構(gòu)

2023-11-07 09:23:27

756

解讀大模型FP量化的解決方案

在 LLaMA, BERT 以及 ViTs 模型上，4-bit 量化皆取得了遠(yuǎn)超 SOTA 的結(jié)果。特別是，這篇文章展示了 4-bit 量化的 LLaMA-13B 模型，在零樣本推理任務(wù)上達(dá)到平均

2023-11-24 11:15:55

299

大模型筆記之gem5運(yùn)行模型框架LLama介紹

LLama.cpp 支持x86，arm，gpu的編譯。

2024-01-22 09:10:16

317

AI大模型商業(yè)化，小i機(jī)器人華藏生態(tài)迎來“變現(xiàn)”

和一個(gè)產(chǎn)品支撐,以及三項(xiàng)服務(wù)保障。 ? 一個(gè)能力基座指的是華藏通用大模型具備文生圖、文修圖和圖生文等數(shù)百項(xiàng)通用大模型基礎(chǔ)能力。一個(gè)產(chǎn)品支撐指的是由生態(tài)開發(fā)板塊、生態(tài)應(yīng)用板塊和生態(tài)運(yùn)營板塊組成的華藏開發(fā)者平臺。其中在

2023-11-02 00:09:00

1090

2022年HarmonyOS/OpenHarmony生態(tài)觀察

一、鴻蒙生態(tài)世界快速構(gòu)建升級中HarmonyOS鴻蒙2019年正式面世，當(dāng)時(shí)消費(fèi)者只能在華為的智慧屏上體驗(yàn)；2020年，鴻蒙智聯(lián)-華為面向智能硬件生態(tài)伙伴全新品牌和開放平臺發(fā)布；2021年，智能手機(jī)

2023-01-19 13:10:06

生態(tài)穩(wěn)定在214009和PRO/PSoC4-BLE模塊？

在214009模塊中，生態(tài)系統(tǒng)從深度睡眠中獲得穩(wěn)定的時(shí)間是多少？以上來自于百度翻譯以下為原文What is the time it takes for the ECO to become stable from deepsleep in the 214009 module?

2018-08-28 14:52:58

DC-DC電源芯片的使用梳理

今天閑來無事，把DC-DC電源芯片的使用大概梳理一下，同時(shí)呢，也讓自己加深一下印象，不至于別人突然考你的時(shí)候，首鼠兩端、舉棋不定，哈哈哈哈哈哈哈哈哈成語亂用了哈，承讓，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，主要參考MPM3630 即美國芯源系統(tǒng)有限公司(Monolithic Power Sy...

2021-11-16 09:40:55

ERP、CRM實(shí)施中流程的梳理？

，我們辛辛苦苦地組織了公司流程梳理工作，各項(xiàng)流程都進(jìn)行了圖示化，并將流程中的職責(zé)、權(quán)限、相關(guān)制度、標(biāo)準(zhǔn)都進(jìn)行了清晰的界定。但是，公司領(lǐng)導(dǎo)及各部門并不認(rèn)帳，他們認(rèn)為該項(xiàng)工作人力、物力花費(fèi)不少，雖然各項(xiàng)工作

2017-08-17 09:24:35

Labview中如何導(dǎo)入3D 的模型

Labview中如何導(dǎo)入3D 的模型，例如3Dmax生成的模型。嘗試過用.STL格式導(dǎo)入Labview。但是3D模型的材質(zhì)以及一切特性都沒有了。只有灰色的輪廓。（單色模型）。如何在labview中導(dǎo)入3D模型、并且導(dǎo)入后保持原有顏色和材質(zhì)、貼圖等？？

2014-01-26 13:13:13

OpenHarmony 技術(shù)與生態(tài)交流研討會成功舉辦

必選、同為數(shù)碼等 40 多位企業(yè)代表參加此次會議。會議伊始，鄭飛秘書長對各位嘉賓的到來表示了熱烈歡迎，他談到開源是軟件產(chǎn)業(yè)的活力之源，當(dāng)前我國開源生態(tài)建設(shè)正在快速推進(jìn)中，OpenHarmony 開源

2021-07-20 12:00:24

OpenHarmony現(xiàn)在有生態(tài)APP嗎？從哪里下載？

哪里能下載到OpenHarmony生態(tài)APP

2022-04-14 11:43:54

PCB SI/PI中添加IBIS模型后，sigxplorer中元件模型顯示unknown

cadence中dsp，fpga已經(jīng)添加IBIS模型，為什么在sigxplorer中元件模型下顯示“unknown”

2015-03-29 17:10:16

PMSM的基本數(shù)學(xué)模型和各個(gè)坐標(biāo)變換之間的關(guān)系

的的基本數(shù)學(xué)模型和各個(gè)坐標(biāo)變換之間的關(guān)系，了解兩種常用坐標(biāo)系變換之間的區(qū)別與聯(lián)系。二知識點(diǎn)當(dāng)三相 PMSM 轉(zhuǎn)子磁路的結(jié)構(gòu)不同時(shí)，電機(jī)的運(yùn)行性能、控制方法、制造工藝和適用場合也會不同。目前，根...

2021-08-27 07:02:16

STM32 TIMER知識梳理

STM32定時(shí)器是 ST MCU 內(nèi)部最基礎(chǔ)且常用的外設(shè)，實(shí)際應(yīng)用尤為普遍。去年，電堂推出了《STM32 TIMER基礎(chǔ)及常規(guī)應(yīng)用介紹》，為大家梳理了 STM32 TIMER 的龐大內(nèi)容，涵蓋

2021-12-10 06:21:41

everspin生態(tài)系統(tǒng)和制造工藝創(chuàng)新解析

everspin生態(tài)系統(tǒng)和制造工藝創(chuàng)新

2021-01-01 07:55:49

multisim 中 MOSFET 如何修改器件參數(shù)模型，器件模型中的數(shù)據(jù)都是什么含義，是否有大神?。?/a>

multisim 中 MOSFET 如何修改器件參數(shù)模型，器件模型中的數(shù)據(jù)都是什么含義，是否有大神??！

2017-02-14 16:13:46

saber中IGBT模型如何設(shè)置

請教：saber中IGBT模型有若干種，具體參數(shù)如何設(shè)計(jì)？

2014-04-21 16:29:45

【EVB-335X-II申請】水庫生態(tài)檢測系統(tǒng)

分組成：水質(zhì)檢測部分、水位檢測部分、水庫安防部分。具有以下功能：1、水量調(diào)度。（檢測水庫各個(gè)出水口的出水量，根據(jù)實(shí)際情況作出合理調(diào)度）2、保證最小生態(tài)徑流量目標(biāo)（生態(tài)調(diào)度要滿足河流一定的生態(tài)需水要求,維持河流生態(tài)平衡,不允許時(shí)段下泄的徑流量小于最小生態(tài)徑流量,更不能造成河段斷流、干涸）

2015-10-21 09:21:02

【Thunderboard Sense試用體驗(yàn)】之（三）梳理供電問題

紐扣電池、USB在內(nèi)的多種方式，本節(jié)對電源供電過程中遇到的各種問題進(jìn)行梳理，希望給大家以參考。1、電池供電問題描述：拿到開發(fā)板后，立馬安裝CR2032紐扣電池，發(fā)現(xiàn)信號指示燈不亮，手機(jī)掃描藍(lán)牙，也沒有

2017-06-16 11:17:09

【報(bào)名開啟】繁榮生態(tài)，人才先行︱首屆OpenHarmony人才生態(tài)大會即將在上海召開

共建單位代表等，介紹OpenHarmony社區(qū)生態(tài)及人才進(jìn)展、展示OpenHarmony操作系統(tǒng)的技術(shù)革新、分享階段性技術(shù)成果，圍繞OpenHarmony人才生態(tài)發(fā)展中面臨的各種問題、挑戰(zhàn)與實(shí)踐，一同

2023-12-04 16:23:07

【飛騰派4G版免費(fèi)試用】仙女姐姐的嵌入式實(shí)驗(yàn)室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

預(yù)訓(xùn)練語言模型。該模型最大的特點(diǎn)就是基于以較小的參數(shù)規(guī)模取得了優(yōu)秀的性能，根據(jù)官網(wǎng)提供的信息，LLaMA的模型包含4個(gè)版本，最小的只有70億參數(shù)，最大的650億參數(shù)，但是其性能相比較之前的OPT

2023-12-22 10:18:11

一文幫你梳理Cortex與ARMv8等基礎(chǔ)概念

到底什么是Cortex、ARMv8、arm架構(gòu)、ARM指令集、soc？一文幫你梳理基礎(chǔ)概念【科普】1. 從0開始學(xué)ARM-安裝Keil MDK uVision集成開發(fā)環(huán)境

2021-12-14 08:20:33

三相不控整流的數(shù)學(xué)模型

三相整流的模型簡單，但是具體的各個(gè)時(shí)刻的電流，電壓波形，在VSR電路中究竟是怎樣的。是否能用函數(shù)描述，各個(gè)不同時(shí)刻電流的波形。并用mathcad得出實(shí)際波形

2023-05-23 13:44:06

什么是STM32Cube生態(tài)系統(tǒng)？

2021-09-29 06:12:50

如何在Allegro中添加模型？

allegro中這個(gè)怎么樣添加模型？

2019-08-01 05:35:21

如何構(gòu)建UVM寄存器模型并將寄存器模型集成到驗(yàn)證環(huán)境中

），通常也叫寄存器模型，顧名思義就是對寄存器這個(gè)部件的建模。本文要介紹的內(nèi)容，包括對UVM寄存器模型的概述，如何構(gòu)建寄存器模型，以及如何將寄存器模型集成到驗(yàn)證環(huán)境中。篇幅原因，將在下一篇文章再給出寄存器

2022-09-23 14:29:03

如何檢測開關(guān)電源中的各個(gè)元器件？

開關(guān)電源中的各個(gè)元器件是如何檢驗(yàn)的？

2021-03-10 07:30:08

嵌入式系統(tǒng)概述知識梳理

2021-12-22 06:53:19

開發(fā)者如何快速加入鴻蒙生態(tài)？（學(xué)習(xí)方法+職業(yè)定位）

HarmonyOS/OpenHarmony開發(fā)者們在學(xué)習(xí)、成長中對自己的準(zhǔn)確的定位，包括個(gè)人開發(fā)者、企業(yè)開發(fā)者、各個(gè)不同職能的開發(fā)者等對應(yīng)的在鴻蒙生態(tài)中的各項(xiàng)具體的參與方式與路徑、各項(xiàng)具體的機(jī)會

2021-11-10 16:04:31

怎樣將matlab中的數(shù)學(xué)模型封裝成物理電氣模型

各位朋友，本人現(xiàn)在正在搭建雙饋異步電機(jī)的內(nèi)部模型，但是要和外部的電氣模型連接起來，不知道怎樣把數(shù)學(xué)模型封裝成電氣模型啊，在MATLAB中，有個(gè)三相異步電機(jī)的原始電氣模型，打開里面的建模，是將數(shù)學(xué)模型封裝成電氣模型的，但是卻看不到是如何封裝的，希望各位多多幫忙啊，大家可以交流下！

2012-12-13 21:37:21

浩辰3D軟件中如何創(chuàng)建槽特征？3D模型設(shè)計(jì)教程！

，然后單擊新槽(2) 的路徑，最后單擊以放置新槽 (3)。可以每次一個(gè)或每個(gè)圍欄一個(gè)地添加更多槽，或者選擇多個(gè)路徑來同時(shí)創(chuàng)建多個(gè)槽。以上就是小編為大家梳理的浩辰3D軟件中槽特征的創(chuàng)建教程，在實(shí)際的3D模型設(shè)計(jì)過程中大家可以參考本篇教程來操作哦~想GET更多3D繪圖技巧嗎？那趕緊關(guān)注我吧！

2020-09-28 16:16:56

深度學(xué)習(xí)模型是如何創(chuàng)建的？

具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個(gè)行業(yè)的企業(yè)和組織。深度學(xué)習(xí)模型可以幫助實(shí)現(xiàn)工業(yè)流程自動化，進(jìn)行實(shí)時(shí)分析以做出決策，甚至可以預(yù)測預(yù)警。這些AI

2021-10-27 06:34:15

物聯(lián)網(wǎng)時(shí)代下的MCU呈現(xiàn)出了新的應(yīng)用生態(tài)

在物聯(lián)網(wǎng)應(yīng)用發(fā)展中，MCU的應(yīng)用生態(tài)也發(fā)生了一些改變，呈現(xiàn)出了新的應(yīng)用生態(tài)。目前，物聯(lián)網(wǎng)應(yīng)用基本都是將傳感終端連接到云端，基本遵循云－管－端的架構(gòu)。MCU的應(yīng)用一般是在“管”和“端”，管指的是連接通信的管道，端是設(shè)備終端或傳感終端。下圖是MCU在物聯(lián)網(wǎng)中應(yīng)用生態(tài)的示意圖：物聯(lián)網(wǎng)應(yīng)用中MCU應(yīng)用生態(tài)示意圖

2019-07-15 06:43:05

電機(jī)控制開發(fā)中基于模型的設(shè)計(jì)

硬件平臺電機(jī)控制開發(fā)中基于模型的設(shè)計(jì)，需要先考慮目標(biāo)硬件。硬件平臺由一個(gè)電機(jī)驅(qū)動、一個(gè)3相永磁電機(jī)和一臺裝有MATLAB、Simulink和IAR Embedded Workbench的個(gè)人電腦構(gòu)成。圖

2018-06-21 11:50:12

請問模型編譯中是否支持模型的在線編譯？

模型編譯中是否支持模型的在線編譯？

2023-09-18 07:24:28

林地生態(tài)水文監(jiān)測系統(tǒng)

林地生態(tài)水文監(jiān)測系統(tǒng)FT-SWQX在森林資源保護(hù)的工作中有非常重要的作用，我們都知道，森林的保護(hù)和樹木的生長也是萬萬離不開水資源的支持的，而且森林的存在就像是地球的肺，是重要的循環(huán)和呼吸部分。通過

2021-05-21 17:27:38

PSR模型支持下重慶市主城區(qū)生態(tài)安全評價(jià)_黃鴻

PSR模型支持下重慶市主城區(qū)生態(tài)安全評價(jià)_黃鴻

2017-03-19 11:27:34

流域重金屬生態(tài)風(fēng)險(xiǎn)評估系統(tǒng)模型綜述

針對流域重金屬生態(tài)風(fēng)險(xiǎn)評價(jià)缺乏實(shí)時(shí)、有效的方法和監(jiān)測技術(shù)的現(xiàn)狀，利用遙感和氣象數(shù)據(jù)構(gòu)建合理準(zhǔn)確的評估模型監(jiān)控決策流域環(huán)境狀況，釆集和收集硏究區(qū)域流域內(nèi)的氣象遙感以及土壤重金屬數(shù)據(jù)，并結(jié)合

2021-04-29 11:36:37

“伶荔”(Linly) 開源大規(guī)模中文語言模型

Linly-Chinese-LLaMA：中文基礎(chǔ)模型，基于 LLaMA 在高質(zhì)量中文語料上增量訓(xùn)練強(qiáng)化中文語言能力，現(xiàn)已開放 7B、13B 和 33B 量級，65B 正在訓(xùn)練中。

2023-05-04 10:29:07

706

軟通動力成為文心千帆大模型平臺生態(tài)伙伴

在2023百度智能云合作伙伴大會·廣州站，28家合作伙伴與百度智能云簽約。軟通動力簽約文心千帆大模型平臺生態(tài)伙伴，軟通動力副總裁王峰出席并參與簽約儀式。軟通動力將與百度智能云推動大模型在工業(yè)互聯(lián)網(wǎng)、銀行、汽車等多個(gè)行業(yè)落地應(yīng)用，賦能客戶數(shù)智化轉(zhuǎn)型，構(gòu)建面向行業(yè)的智能應(yīng)用。

2023-05-22 17:50:06

398

基于LLAMA的魔改部署

去訓(xùn)練），并且和Vision結(jié)合的大模型也逐漸多了起來。所以怎么部署大模型是一個(gè) 超級重要的工程問題，很多公司也在緊鑼密鼓的搞著。目前效果最好討論最多的開源實(shí)現(xiàn)就是LLAMA，所以我這里討論的也是基于 LLAMA的魔改部署。基于LLAMA的finetune模型

2023-05-23 15:08:47

4397

State of GPT：大神Andrej揭秘OpenAI大模型原理和訓(xùn)練過程

你可以看到，Llama 的參數(shù)數(shù)量大概是 650 億?，F(xiàn)在，盡管與 GPT3 的 1750 億個(gè)參數(shù)相比，Llama 只有 65 個(gè) B 參數(shù)，但 Llama 是一個(gè)明顯更強(qiáng)大的模型，直觀地說，這是

2023-05-30 14:34:56

642

我在iPhone上裝了70億參數(shù)大模型，來自陳天奇團(tuán)隊(duì)最新成果

目前可以測試的模型有羊駝家族（基于LLaMA）的RedPajama和Vicuna?？蛇x模型參數(shù)分別為30億和70億，與很多在線Demo規(guī)模也相當(dāng)了。

2023-06-07 16:12:00

301

擊敗LLaMA？史上最強(qiáng)「獵鷹」排行存疑，符堯7行代碼親測，LeCun轉(zhuǎn)贊

「我們在MMLU上復(fù)現(xiàn)了LLaMA 65B的評估，得到了61.4的分?jǐn)?shù)，接近官方分?jǐn)?shù)（63.4），遠(yuǎn)高于其在Open LLM Leaderboard上的分?jǐn)?shù)（48.8），而且明顯高于獵鷹（52.7）?！?/div>

2023-06-09 16:43:14

820

號稱「碾壓」LLaMA的Falcon實(shí)測得分僅49.08，HuggingFace決定重寫排行榜代碼

這是一組由 Meta 開源的大型語言模型，共有 7B、13B、33B、65B 四種版本。其中，LLaMA-13B 在大多數(shù)數(shù)據(jù)集上超過了 GPT-3（175B），LLaMA-65B 達(dá)到了和 Chinchilla-70B、PaLM-540B 相當(dāng)?shù)乃健?/div>

2023-06-11 11:24:20

421

智能開源大模型baichuan-7B技術(shù)改進(jìn)

baichuan-7B 主要是參考LLaMA進(jìn)行的改進(jìn)，且模型架構(gòu)與LLaMA一致。而在開源大模型中，LLaMA無疑是其中最閃亮的星，但LLaMA存在如下問題： LLaMA 原生僅支持 Latin

2023-06-17 14:14:28

706

RISC-V跑大模型（二）：LLaMA零基礎(chǔ)移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環(huán)境里。

2023-07-10 10:10:38

706

高通攜手Meta利用Llama 2賦能終端側(cè)AI應(yīng)用

和服務(wù)相比，終端側(cè)AI部署能夠助力開發(fā)者以顯著降低的成本，提升用戶隱私保護(hù)、滿足用戶安全偏好、增強(qiáng)應(yīng)用可靠性，并實(shí)現(xiàn)個(gè)性化。高通技術(shù)公司和Meta正在合作優(yōu)化Meta Llama 2大語言模型直接在終端側(cè)的執(zhí)行，無需僅依賴云服務(wù)。能夠在智能手機(jī)、PC、VR/AR頭顯和汽車等終

2023-07-19 10:00:02

323

高通攜手Meta利用Llama 2賦能終端側(cè)AI應(yīng)用

高通計(jì)劃從2024年起，在旗艦智能手機(jī)和PC上支持基于Llama 2的AI部署，賦能開發(fā)者使用驍龍平臺的AI能力，推出激動人心的全新生成式AI應(yīng)用。

2023-07-19 10:00:03

462

高通攜手Meta利用Llama 2賦能終端側(cè)AI應(yīng)用

因此，高通技術(shù)公司計(jì)劃支持基于llama 2的終端ai部署，以創(chuàng)建新的、有趣的ai應(yīng)用程序。通過這種方式，客戶、合作伙伴和開發(fā)者可以構(gòu)建智能模擬器、生產(chǎn)力應(yīng)用程序、內(nèi)容制作工具和娛樂等的使用案例。驍龍?賦能實(shí)現(xiàn)的新終端ai體驗(yàn)，即使在飛行模式下，也可以在沒有網(wǎng)絡(luò)連接的地區(qū)運(yùn)行。

2023-07-19 10:26:38

345

微軟聯(lián)合Meta發(fā)布免費(fèi)商業(yè)應(yīng)用的開源AI模型Llama 2

在 Meta 看來，「開放的方法是當(dāng)今人工智能模型開發(fā)的正確方法，特別是在技術(shù)快速發(fā)展的生成領(lǐng)域。通過公開提供人工智能模型，它們可以使每個(gè)人受益。為企業(yè)、初創(chuàng)企業(yè)、企業(yè)家和研究人員提供其開發(fā)的工具，這些工具的開發(fā)規(guī)模是他們自己難以構(gòu)建的

2023-07-19 16:22:15

485

AI競賽追趕者聯(lián)盟？“云-邊”一體或成為AI應(yīng)用閉環(huán)的必由之路

當(dāng)?shù)貢r(shí)間7月18日，Meta宣布，將發(fā)布其開源大模型LLaMA商用版本，新版本名為Llama 2。

2023-07-20 10:27:59

193

Meta推出免費(fèi)大模型Llama 2，GPT要有危機(jī)感了

作為Meta首批合作伙伴之一，亞馬遜云科技宣布客戶可以通過Amazon SageMaker JumpStart來使用Meta開發(fā)的Llama 2基礎(chǔ)模型。

2023-07-21 16:10:59

904

Llama2的技術(shù)細(xì)節(jié)探討分析

模型結(jié)構(gòu)為Transformer結(jié)構(gòu)，與Llama相同的是采用RMSNorm歸一化、SwiGLU激活函數(shù)、RoPE位置嵌入、詞表的構(gòu)建與大小，與Llama不同的是增加GQA（分組查詢注意力），擴(kuò)增了模型輸入最大長度，語料庫增加了40%。

2023-07-23 12:36:54

1098

Llama 2性能如何

在幾乎所有基準(zhǔn)上，Llama 2 70B 的結(jié)果均與谷歌 PaLM (540B) 持平或表現(xiàn)更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

2023-07-23 13:00:13

1118

英特爾一系列AI解決方案，為Llama 2大模型提供實(shí)力之選

英特爾廣泛的AI硬件組合及開放的軟件環(huán)境，為Meta發(fā)布的Llama 2模型提供了極具競爭力的選擇，進(jìn)一步助力大語言模型的普及，推動AI發(fā)展惠及各行各業(yè)。大語言模型（LLM）在生成文本、總結(jié)和翻譯

2023-07-24 19:31:56

387

Llama 2 登陸 Azure 和 Windows，微軟與 Meta 拓展人工智能合作伙伴關(guān)系

和 Windows 上支持 Llama 2 大型語言模型（LLM）系列。Llama 2 旨在幫助開發(fā)者和組織構(gòu)建生成式人工智能工具和體驗(yàn)。Meta 和微軟共同致力于實(shí)現(xiàn)“讓人工智能惠及更多

2023-07-26 10:35:01

303

Meta推出Llama 2 免費(fèi)開放商業(yè)和研究機(jī)構(gòu)使用

與所有LLM一樣，Llama 2偶爾會產(chǎn)生不正確或不可用的答案，但Meta介紹Llama的論文聲稱，它在學(xué)術(shù)基準(zhǔn)方面與OpenAI的GPT 3.5不相上下，如MMLU（衡量LLM在57門STEM科目中的知識）和GSM8K（衡量LLM對數(shù)學(xué)的理解）。

2023-08-02 16:17:25

410

爆火Llama 2一周請求下載超15萬，有人開源了Rust實(shí)現(xiàn)版本

500 行 C 語言就實(shí)現(xiàn)了對 Llama 2 baby 模型的推理。該項(xiàng)目可以在蘋果 M1 筆記本上每秒輸出 98 個(gè) token。

2023-08-02 16:25:28

470

IBM 計(jì)劃在 watsonx 平臺上提供 Meta 的 Llama 2 模型

IBM 企業(yè)就緒的 AI 和數(shù)據(jù)平臺?watsonx?不斷推出新功能。IBM 宣布，計(jì)劃在 watsonx 的 AI 開發(fā)平臺?watsonx.ai?上納入?Meta?的 700?億參數(shù) Llama

2023-08-09 20:35:01

314

壁仞科技與百度聯(lián)合發(fā)起飛槳+文心大模型硬件生態(tài)共創(chuàng)計(jì)劃

8月16日，壁仞科技在Wave Summit 2023深度學(xué)習(xí)開發(fā)者大會上正式宣布與百度聯(lián)合發(fā)起飛槳+文心大模型硬件生態(tài)共創(chuàng)計(jì)劃。雙方將共同推進(jìn)在壁仞科技壁礪系列通用GPU產(chǎn)品

2023-08-17 10:52:19

239

【AI簡報(bào)20230818期】人形機(jī)器人問世：大模型加持；用AI微調(diào)AI，微軟全華班出品！

1. 騰訊云宣布全面支持Llama2等主流開源模型原文： https://t.cj.sina.com.cn/articles/view/1654203637/629924f5020010xw1

2023-08-18 18:15:03

746

Meta即將推出開源代碼生成平臺Code Llama，劍指OpenAI Codex

Code Llama 的卓越功能源自行業(yè)領(lǐng)先的 AI 算法。其核心模型由包含編程語言、編碼模式和最佳實(shí)踐的大規(guī)模數(shù)據(jù)集訓(xùn)練而成。自然語言處理（NLP）技術(shù)則讓 Code Llama 有能力理解開發(fā)者的輸入，并生成與上下文相匹配的代碼建議。

2023-08-21 15:15:02

570

深入理解Llama模型的源碼案例

目前大部分開源LLM模型都是基于transformers庫來做的，它們的結(jié)構(gòu)大部分都和Llama大同小異。

2023-08-23 11:44:07

1462

關(guān)于Llama 2的一切資源，我們都幫你整理好了

Meta 發(fā)布的 Llama 2，是新的 SOTA 開源大型語言模型（LLM）。Llama 2 代表著 LLaMA 的下一代版本，可商用。Llama 2 有 3 種不同的大小 —— 7B、13B 和 70B 個(gè)可訓(xùn)練參數(shù)。

2023-08-23 15:40:09

674

MediaTek運(yùn)用Meta Llama 2大語言模型，賦能終端設(shè)備生成式AI應(yīng)用

2023 年 8 月 24 日 – MediaTek今日宣布利用Meta新一代開源大語言模型（LLM）Llama 2 以及MediaTek先進(jìn)的AI處理器（APU）和完整的AI開發(fā)平臺

2023-08-24 13:41:03

225

Meta發(fā)布一款可以使用文本提示生成代碼的大型語言模型Code Llama

今天，Meta發(fā)布了Code Llama，一款可以使用文本提示生成代碼的大型語言模型（LLM）。

2023-08-25 09:06:57

885

Meta將推出編程人工智能工具：Code Llama，免費(fèi)提供

據(jù)路透社報(bào)道，meta計(jì)劃推出全新編程人工智能模型：Code Llama，可以根據(jù)文字提示來編寫計(jì)算機(jī)代碼，或協(xié)助開發(fā)者編程。這一AI工具將免費(fèi)提供。

2023-08-25 11:39:00

493

Meta發(fā)布一種Code Llama工具用于生成新代碼和調(diào)試人工編寫工作

Meta公司表示，Meta發(fā)布了一種名為Code Llama的工具，該工具建立在其Llama 2大型語言模型的基礎(chǔ)上，用于生成新代碼和調(diào)試人工編寫的工作。 Code Llama將使用與Llama

2023-08-28 16:56:39

932

端側(cè)大模型到通用智能體——智能手機(jī)AI進(jìn)化的下一場革命(一)

時(shí)隔半年后，Meta AI在周二發(fā)布了最新一代開源大模型Llama 2。相較于今年2月發(fā)布的Llama 1，訓(xùn)練所用的token翻了一倍至2萬億，同時(shí)對于使用大模型最重要的上下文長度限制，Llama 2也翻了一倍。Llama 2包含了70億、130億和700億參數(shù)的模型。

2023-08-29 16:50:10

950

華為宣布全面建設(shè)盤古大模型全域協(xié)同生態(tài)

華為云盤古大模型主題論壇上，華為云EI服務(wù)產(chǎn)品部部長尤鵬宣布了建設(shè)盤古大模型全域協(xié)同生態(tài)的計(jì)劃。他表示，華為云將與各行各業(yè)的客戶和伙伴共同合作，共享盤古大模型帶來的行業(yè)AI新機(jī)遇。

2023-08-31 11:45:47

928

8G顯存一鍵訓(xùn)練，解鎖Llama2隱藏能力！XTuner帶你玩轉(zhuǎn)大模型

針對 GPU 計(jì)算特點(diǎn)，在顯存允許的情況下，XTuner 支持將多條短數(shù)據(jù)拼接至模型最大輸入長度，以此最大化 GPU 計(jì)算核心的利用率，可以顯著提升訓(xùn)練速度。例如，在使用 oasst1 數(shù)據(jù)集微調(diào) Llama2-7B 時(shí)，數(shù)據(jù)拼接后的訓(xùn)練時(shí)長僅為普通訓(xùn)練的 50% 。

2023-09-04 16:12:26

1242

LLaMA微調(diào)顯存需求減半，清華提出4比特優(yōu)化器

從 GPT-3，Gopher 到 LLaMA，大模型有更好的性能已成為業(yè)界的共識。但相比之下，單個(gè) GPU 的顯存大小卻增長緩慢，這讓顯存成為了大模型訓(xùn)練的主要瓶頸，如何在有限的 GPU 內(nèi)存下訓(xùn)練大模型成為了一個(gè)重要的難題。

2023-09-11 16:08:49

240

開源大模型Falcon（獵鷹） 180B發(fā)布 1800億參數(shù)

? 世界最強(qiáng)開源大模型 Falcon 180B 忽然火爆全網(wǎng)，1800億參數(shù)，F(xiàn)alcon 在 3.5 萬億 token 完成訓(xùn)練，性能碾壓 Llama 2，登頂 Hugging Face 排行榜

2023-09-18 09:29:05

876

ChatGPT→LLaMA→Apple GPT：盤點(diǎn)國外大模型產(chǎn)業(yè)發(fā)展之路

大模型與AIGC為人工智能領(lǐng)域帶來了新變化。從當(dāng)前大模型的發(fā)展趨勢看，大模型企業(yè)更傾向于搭建平臺，對傳統(tǒng)企業(yè)進(jìn)行賦能。具體而言，大模型企業(yè)憑借對組織型用戶“痛點(diǎn)”的了解

2023-09-19 18:00:12

704

浪潮信息NF5468服務(wù)器LLaMA訓(xùn)練性能

的浪潮信息NF5468服務(wù)器大幅提升了LLaMA大模型的微調(diào)訓(xùn)練性能。目前該產(chǎn)品已具備交付能力，客戶可以進(jìn)行下單采購。

2023-09-22 11:16:31

1813

怎樣使用QLoRA對Llama 2進(jìn)行微調(diào)呢？

使用QLoRA對Llama 2進(jìn)行微調(diào)是我們常用的一個(gè)方法，但是在微調(diào)時(shí)會遇到各種各樣的問題

2023-09-22 14:27:21

939

在線研討會 | 基于 LLM 構(gòu)建中文場景檢索式對話機(jī)器人：Llama2 + NeMo

Llama2 的出現(xiàn)掀起了開源大模型的熱潮，相比于前身 Llama1，Llama2 的訓(xùn)練數(shù)據(jù)多了 40%，經(jīng)過了 2 萬億個(gè)標(biāo)記的訓(xùn)練，上下文長度也翻倍，token 從 2,048 增加到

2023-10-13 20:35:02

564

如何本地部署大模型

近期，openEuler A-Tune SIG在openEuler 23.09版本引入llama.cpp&chatglm-cpp兩款應(yīng)用，以支持用戶在本地部署和使用免費(fèi)的開源大語言模型，無需聯(lián)網(wǎng)也能使用！

2023-10-18 11:48:12

1365

華為云發(fā)布三大基礎(chǔ)方案和AI出海計(jì)劃加速大模型生態(tài)發(fā)展

，華為云重磅發(fā)布了基于盤古大模型打造的三大基礎(chǔ)解決方案和華為云AI出海計(jì)劃。華為云EI服務(wù)產(chǎn)品部部長尤鵬做開場致辭，分享了盤古大模型生態(tài)和昇騰AI云服務(wù)的最新進(jìn)展和成果，他表示：“獨(dú)行快、眾行遠(yuǎn)，華為云致力于打造開放、活力

2023-11-23 11:25:12

240

一種新穎的大型語言模型知識更新微調(diào)范式

我們使用LLAMA2-7B作為實(shí)驗(yàn)的基礎(chǔ)模型。我們主要評估將舊知識更新為新知識的能力，因此模型將首先在舊知識上進(jìn)行為期3個(gè)時(shí)期的微調(diào)。表1中F-Learning中設(shè)置的超參數(shù)λ分別取值為0.3、0.7、0.1和1.5。

2023-12-01 15:10:45

141

一種新大模型安全問題之隱式有害內(nèi)容輸出

使用了LLaMA-13B來訓(xùn)練模型和獎勵模型，使用BAD模型作為有害內(nèi)容檢測模型。

2023-12-04 13:57:12

143

大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對大語言模型進(jìn)行介紹。大語言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓(xùn)練語言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語言處理任務(wù)，如文本生成、機(jī)器翻譯和自然語言理解等。

2023-12-04 15:51:46

356

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個(gè)調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當(dāng)，甚至更好。

2023-12-26 14:23:16

247

Meta推出“性能最優(yōu)”代碼生成AI模型Code Llama 70B

據(jù)悉，Code Llama工具于去年8月份上線，面向公眾開放且完全免費(fèi)。此次更新的Code Llama 70B不僅能處理更多復(fù)雜查詢，其在HumanEval基準(zhǔn)測試中的準(zhǔn)確率高達(dá)53%，超越GPT-3.5的48.1%，然而與OpenAI公布的GPT-4準(zhǔn)確率（67%）仍有一定差距。

2024-01-30 10:36:18

279