久久精品亚洲精品无码,性888XXXx入欧美,宅男噜噜66国产精品

Ambarella前不久展示了在其CV3-AD 芯片上運行LLM的能力。這款芯片是CV3系列中最強大的，專為自動駕駛設(shè)計。

CV3-AD一年前開始出樣，使用Ambarella現(xiàn)有的AI軟件堆棧，運行Llama2-13B模型時，可以實現(xiàn)每秒推理25個token。

Ambarella的CEO Fermi Wang表示：“當(dāng)transformer在今年早些時候變得流行時，我們開始問自己，我們擁有一個強大的推理引擎，我們能做到嗎？我們進行了一些快速研究，發(fā)現(xiàn)我們確實可以。我們估計我們的性能可能接近Nvidia A100。”

Ambarella工程師正在展示Llama2-13B在CV3-AD上的實時演示，CV3-AD是一款50W的自動駕駛芯片。

Ambarella芯片上的CVFlow引擎包括其NVP（Neural Vector Processor）和一個GVP（General Vector Processor），演示中的LLM正在NVP上運行。NVP采用數(shù)據(jù)流架構(gòu)，Ambarella已將諸如卷積之類的高級運算符指令組合成圖表，描述數(shù)據(jù)如何通過處理器進行該運算符的處理。所有這些運算符之間的通信都使用片上內(nèi)存完成。CV3系列使用LPDDR5（而非HBM），功耗約為50W。

Ambarella的CTO Les Kohn表示，LLM演示確實需要一些新軟件。實現(xiàn)transformer架構(gòu)核心操作的構(gòu)建模塊，目前這些操作針對的是像Llama2這樣的模型。

他說：“隨著時間的推移，我們將擴展這些功能以覆蓋其它模型，但Llama2正在成為開源世界的事實標(biāo)準(zhǔn)。這絕對是一項不小的投資，但與從頭開始開發(fā)軟件相比，還差得遠?！?

Edge LLM發(fā)展路線圖?????

Wang表示：“現(xiàn)在我們知道我們擁有這項技術(shù)，我們可以解決一些實際問題。如果你與LLM的研發(fā)人員交談，問他們最頭疼的是什么，一個顯然是價格，另一個是功耗?！?

CV3-AD設(shè)計用于50W的功率范圍（包括整個芯片的功率，不僅僅是AI加速器）。因此，Wang希望Ambarella能夠以大約四分之一的功耗，為LLM提供與A100相似的性能。

他說：“這意味著對于固定的數(shù)據(jù)中心功率，我可以增加四倍的AI性能。這是巨大的價值。盡管這種想法很簡單，但我們相信我們可以為渴望使用LLM的任何人提供價值。在過去的六個月里，渴望使用LLM的人數(shù)迅速增加。”

雖然超大規(guī)模計算中心可能是首批跟進LLM趨勢的，但Ambarella在安防攝像頭和汽車領(lǐng)域的現(xiàn)有客戶開始考慮如何在他們的邊緣系統(tǒng)中實施LLM，以及LLM將如何實施他們的發(fā)展路線圖。

Wang說：“我們相信LLM將成為我們需要在路線圖中為當(dāng)前客戶提供的重要技術(shù)。當(dāng)前的CV3可以運行LLM，而無需Ambarella進行太多額外的工程投資，所以這對我們來說并非分心之事。我們當(dāng)前的市場在他們的路線圖中已經(jīng)有了LLM?！? 多模態(tài)AI???? Kohn指出，在邊緣計算中，具有生成文本和圖像能力的大型多模態(tài)生成型AI潛力日益增大。

他說：“對于像機器人這樣的應(yīng)用，transformer網(wǎng)絡(luò)已經(jīng)可以用于計算機視覺處理，這比任何傳統(tǒng)計算機視覺模型都要強大，因為這種模型可以處理零樣本學(xué)習(xí)，這是小模型無法做到的。”

零樣本學(xué)習(xí)指的是模型能夠推斷出在其訓(xùn)練數(shù)據(jù)中未出現(xiàn)的對象類別的信息。這意味著模型可以以更強大的方式預(yù)測和處理邊緣情況，這在自動系統(tǒng)中尤其重要。

他補充說：“自動駕駛本質(zhì)上是一種機器人應(yīng)用：如果你看看L4/L5系統(tǒng)需要什么，很明顯你需要更強大、更通用的AI模型，這些模型能以更類似于人類的方式理解世界，超越我們今天的水平。我們將這看作是為各種邊緣應(yīng)用獲取更強大的AI處理能力的一種方式。”

LLM發(fā)展路線圖??

問及Ambarella是否會制造專門針對LLM的邊緣芯片時，Wang表示：“這可能是我們需要考慮的事情。我們需要一個具有更多AI性能的LLM路線圖。LLM本身需要大量的DRAM帶寬，這幾乎使得在芯片上集成其他功能變得不可能（因為其他功能也需要DRAM帶寬）?！?/p>

Wang說，盡管在某些人看來，一個大型信息娛樂芯片應(yīng)該能夠同時處理其他工作負載和LLM，但目前這是不可能的。LLM所需的性能和帶寬或多或少地需要一個單獨的加速器。

Kohn補充說：“這取決于模型的大小。我們可能會看到目前使用的模型比較小的版本應(yīng)用于像機器人學(xué)這樣的領(lǐng)域，因為它們不需要處理大型模型所做的所有通用事務(wù)。但與此同時，人們希望有更強大的性能。所以，我認為最終我們將看到未來更優(yōu)化的解決方案，它們將被應(yīng)用于不同的價格/性能點?！?/p>

在邊緣計算之外，CV3系列也有可能在數(shù)據(jù)中心中使用。Kohn說，CV3系列有多個PCIe接口，這在多芯片系統(tǒng)中可能很有用。他還補充說，該公司已經(jīng)有一個可以利用的PCIe卡。

Wang表示：“對我們來說，真正的問題是，‘我們能否將當(dāng)前產(chǎn)品和未來產(chǎn)品銷售到超大規(guī)模計算中心或基于云的解決方案中？’這是一個我們還沒有回答的問題，但我們已經(jīng)確認了技術(shù)的可行性，并且我們有一些差異化。我們知道我們可以將這種產(chǎn)品銷售到邊緣設(shè)備和邊緣服務(wù)器。我們正在制定一個計劃，希望如果我們想要進入基于云的解決方案，我們可以證明進一步投資是合理的?！?/p>

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
18924

瀏覽量
227195
機器人

機器人

+關(guān)注

關(guān)注
210

文章
27835

瀏覽量
204564
LPDDR5

LPDDR5

+關(guān)注

關(guān)注
2

文章
87

瀏覽量
11965
自動駕駛芯片

自動駕駛芯片

+關(guān)注

關(guān)注
3

文章
47

瀏覽量
5057
LLM

LLM

+關(guān)注

關(guān)注
0

文章
247

瀏覽量
279

原文標(biāo)題：Ambarella展示在自動駕駛芯片上的LLM推理能力

文章出處：【微信號：Astroys，微信公眾號：Astroys】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

LLM預(yù)訓(xùn)練的基本概念、基本原理和主要優(yōu)勢

理解和生成自然語言的能力，為各種NLP任務(wù)提供了強大的支持。本文將詳細介紹LLM預(yù)訓(xùn)練的基本概念、基本原理以及主要優(yōu)勢，并附上相關(guān)的代碼示例。

發(fā)表于 07-10 11:03 ?717次閱讀

大模型LLM與ChatGPT的技術(shù)原理

與機器的交互方式。這些技術(shù)通過深度學(xué)習(xí)和自然語言生成（Natural Language Generation, NLG）的結(jié)合，實現(xiàn)了對復(fù)雜語言任務(wù)的高效處理。本文將深入探討大模型LLM和ChatGPT的技術(shù)原理，并通過代碼示例展示

發(fā)表于 07-10 10:38 ?402次閱讀

LLM模型的應(yīng)用領(lǐng)域

在本文中，我們將深入探討LLM（Large Language Model，大型語言模型）的應(yīng)用領(lǐng)域。LLM是一種基于深度學(xué)習(xí)的人工智能技術(shù)，它能夠理解和生成自然語言文本。近年來，隨著計算能力的提高

發(fā)表于 07-09 09:52 ?293次閱讀

什么是LLM？LLM的工作原理和結(jié)構(gòu)

隨著人工智能技術(shù)的飛速發(fā)展，大型語言模型（Large Language Model，簡稱LLM）逐漸成為自然語言處理（NLP）領(lǐng)域的研究熱點。LLM以其強大的文本生成、理解和推理能力，在文本

發(fā)表于 07-02 11:45 ?4294次閱讀

Meta發(fā)布基于Code Llama的LLM編譯器

近日，科技巨頭Meta在其X平臺上正式宣布推出了一款革命性的LLM編譯器，這一模型家族基于Meta Code Llama構(gòu)建，并融合了先進的代碼優(yōu)化和編譯器功能。LLM編譯器的推出，標(biāo)

發(fā)表于 06-29 17:54 ?1303次閱讀

【算能RADXA微服務(wù)器試用體驗】+ GPT語音與視覺交互：1，LLM部署

。環(huán)境變量的配置，未來在具體項目中我們會再次提到。下面我們正式開始項目。項目從輸入到輸出分別涉及了語音識別，圖像識別，LLM，TTS這幾個與AI相關(guān)的模塊。先從最核心的LLM開始。由于LLAMA

發(fā)表于 06-25 15:02

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強大的功能，但通過 OpenVINO? 的優(yōu)化和推理加速，可以對這些復(fù)雜模型的執(zhí)行進行精煉，實現(xiàn)更快、更高效的處理，減少計算開銷并最大限度發(fā)揮硬件潛力，這將直接導(dǎo)致 LLM

發(fā)表于 05-10 10:36 ?379次閱讀

100%在樹莓派上執(zhí)行的LLM項目

ChatGPT的人性口語化回復(fù)相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運作技術(shù)，但LLM運作需要龐大運算力，因此目前多是在云端（Cl

發(fā)表于 02-29 16:29 ?1114次閱讀

超級芯片：云時代的潛在顛覆者

蘋果已經(jīng)開始談?wù)?b class='flag-5'>在其芯片中增加更高端計算能力，此前，英特爾和英偉達也做出了類似的努力。這些新功能旨在在設(shè)備上實現(xiàn)更多的大型語言模型（LLM）

發(fā)表于 01-19 11:08 ?534次閱讀

CV3域控芯片家族又添兩員！各檔規(guī)格完整覆蓋，軟件功能全面兼容

CV3-AD635 和 CV3-AD655 還集成了一對雙核 Cortex R52 CPU。這些 SoC 符合芯片ASIL-B 功能安全標(biāo)準(zhǔn)，其功能安全島符合 ASIL-D標(biāo)準(zhǔn)。此外，兩款芯片

發(fā)表于 01-11 16:44 ?830次閱讀

安霸CV3-AD685 AI域控芯片助力Kodiak開發(fā)下一代自動駕駛卡車

安霸的 CV3-AD685 AI 域控芯片來開發(fā)其新一代自動駕駛卡車使用的嵌入式計算解決方案。通過該芯片，Kodiak 的域控制器支持多個攝像頭、激光雷達和毫米波雷達的同時輸入，并通過 CVflow

發(fā)表于 01-03 10:08 ?1301次閱讀

TensorRT-LLM初探（一）運行llama

TensorRT-LLM正式出來有半個月了，一直沒有時間玩，周末趁著有時間跑一下。

發(fā)表于 11-16 17:39 ?1063次閱讀

深度解讀各種人工智能加速器和GPU上的LLM性能特征

在不同的硬件平臺上評估LLM對于理解傳統(tǒng)和非傳統(tǒng)體系結(jié)構(gòu)的能力和局限性至關(guān)重要。先前的工作已經(jīng)在超級計算機上研究了LLM，并使用傳統(tǒng)的深度學(xué)習(xí)基準(zhǔn)來提供對其

發(fā)表于 10-25 11:49 ?562次閱讀

mlc-llm對大模型推理的流程及優(yōu)化方案

在 MLC-LLM 部署RWKV World系列模型實戰(zhàn)（3B模型Mac M2解碼可達26tokens/s）中提到要使用mlc-llm部署模型首先需要一個編譯過程，將原始的基于Realx搭建的模型

發(fā)表于 09-26 12:25 ?729次閱讀

對比解碼在LLM上的應(yīng)用

為了改進LLM的推理能力，University of California聯(lián)合Meta AI實驗室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實驗表明，所提方法能有效改進

發(fā)表于 09-21 11:37 ?502次閱讀