0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型的“成本瘦身”運(yùn)動(dòng)

腦極體 ? 來(lái)源:腦極體 ? 作者:腦極體 ? 2023-11-03 08:44 ? 次閱讀

數(shù)據(jù)大、參數(shù)量大、算力大,大模型的某些能力才會(huì)“涌現(xiàn)”,這一點(diǎn)在科技圈廣為流傳。

做大模型的主流思想是:不要輕易說(shuō)模型“不行”,如果“它還沒(méi)行”,那就做得更大一點(diǎn)。

所以,不到一年的時(shí)間,大模型的參數(shù)規(guī)模增長(zhǎng)100倍,如今已經(jīng)突破了萬(wàn)億級(jí)別,資源消耗量巨大,也帶來(lái)了越來(lái)越高的存儲(chǔ)成本、推理成本、運(yùn)維成本、落地成本……以及社會(huì)成本。

目前,大模型仍處于商業(yè)化的黎明,如何回收大模型的投入,還存在很多未知數(shù)與不確定,而大模型一直在變大,成了一門極其燒錢的生意,背靠微軟的Open AI,2022年就虧損了5.4 億美元左右。

不斷膨脹的成本,就是一張張真金白銀的賬單,壓在大模型企業(yè)身上的一根根“稻草”。Anthropic的首席執(zhí)行官Dario Amodei最近預(yù)測(cè),在未來(lái)兩年內(nèi),他們的模型成本將達(dá)到100億美元。

除了企業(yè)自身,社會(huì)也同樣在承擔(dān)大模型的隱形成本。谷歌就曾報(bào)告稱,訓(xùn)練 PaLM 在大約兩個(gè)月內(nèi)耗費(fèi)了大約 3.4 千瓦時(shí)的電量,相當(dāng)于300 個(gè)家庭每年的能源消耗總量。大模型高能耗給環(huán)境帶來(lái)的負(fù)擔(dān)和成本,最終由整個(gè)社會(huì)來(lái)買單的。

很顯然,無(wú)論是商業(yè)上、環(huán)境上,比拼模型體量都是不可持續(xù)的。

一味求大的時(shí)代,已經(jīng)過(guò)去了。

問(wèn)題是,怎么給大模型“減負(fù)”呢?

事實(shí)上,通用大模型的頭部廠商,一直都在積極地開(kāi)展“成本瘦身”運(yùn)動(dòng)。

比如微軟在Microsoft Build 2020 上曾公開(kāi)了為GPT-3提供支持的AI supercomputing超級(jí)計(jì)算機(jī),可以讓AI模型的訓(xùn)練效率比其他平臺(tái)高16倍,更快的訓(xùn)練可以降低時(shí)間成本與風(fēng)險(xiǎn)成本。

國(guó)產(chǎn)大模型也不例外。

盤古大模型早在2.0版本中,就嘗試采用稀疏+稠密架構(gòu),以降低訓(xùn)練成本。文心一言推出一個(gè)月以后,也通過(guò)技術(shù)手段將大模型的推理性能提升近10倍,推理成本降到原來(lái)的十分之一。

避免走向臃腫沉重,成為人人都能使用的工具,大模型的“成本瘦身運(yùn)動(dòng)”,勢(shì)在必行。具體怎么實(shí)現(xiàn)?本文就來(lái)談一談這個(gè)問(wèn)題。

一口吃不成胖子

大模型的哪些成本可以優(yōu)化,哪些成本無(wú)法削減,哪些成本還要進(jìn)一步加大投入?搞清楚這些之前,首先得知道是怎么胖的。才能在保證大模型的性能表現(xiàn)和用戶體驗(yàn)(健康)的前提下,合理且精準(zhǔn)地進(jìn)行“成本瘦身”。

簡(jiǎn)單來(lái)說(shuō),AI三要素——數(shù)據(jù)、算力、算法,仍然是決定大模型成本的最關(guān)鍵因素。

先說(shuō)數(shù)據(jù)。garbage in, garbage out,在大模型時(shí)代依然適用。

數(shù)據(jù)質(zhì)量會(huì)直接決定大模型的能力。OpenAI招聘了多位博士來(lái)處理各行業(yè)的專業(yè)數(shù)據(jù),并找了獨(dú)角獸企業(yè)Scale AI等多家數(shù)據(jù)標(biāo)注公司,給GPT-3進(jìn)行大規(guī)模的數(shù)據(jù)集投喂。同時(shí),算法模型會(huì)不斷迭代升級(jí),對(duì)數(shù)據(jù)量的需求會(huì)隨著使用量的上升和性能優(yōu)化而持續(xù)不短的時(shí)間。

中文大模型的成本高,一個(gè)主要原因就是,中文數(shù)據(jù)量和質(zhì)量,與英文還存在差距,訓(xùn)練中文大模型,需要采集和處理的中文語(yǔ)言數(shù)據(jù)更多。另一方面,英語(yǔ)語(yǔ)法結(jié)構(gòu)相比中文更簡(jiǎn)單,中文文本的復(fù)雜性和多樣性,有的中文詞匯可以表達(dá)多種含義,語(yǔ)境豐富,上下文理解的歧義多、難度大,也增加了中文模型的訓(xùn)練難度,需要額外的資源來(lái)支撐中文大模型的訓(xùn)練。

再說(shuō)算力。

大模型的訓(xùn)練、運(yùn)行、服務(wù)、迭代等一整個(gè)全周期,都要計(jì)算和存儲(chǔ)資源。

大模型的訓(xùn)練,主打一個(gè)“暴力美學(xué)”,參數(shù)越大,訓(xùn)練所用的計(jì)算資源就越多。GPT-3所使用的超級(jí)計(jì)算機(jī),包含了一萬(wàn)個(gè)GPU、285000個(gè)處理器內(nèi)核。國(guó)內(nèi)的文心4.0,也是基于飛槳平臺(tái)在萬(wàn)卡集群訓(xùn)練出來(lái)的。

這還不算完。大模型在部署后開(kāi)放服務(wù),隨著使用量的增加,要完成的推理任務(wù)也越來(lái)越多。24小時(shí)進(jìn)行大量的“思考”和“輸出”,這個(gè)推理過(guò)程,也會(huì)持續(xù)消耗計(jì)算資源,就像人腦在處理大量復(fù)雜任務(wù)時(shí),需要消耗糖原,很容易感到饑餓,得大吃一頓來(lái)補(bǔ)充能量。所以,大模型的推理成本也是很高的。

175B的GPT-3部署后的推理至少需要五個(gè)A100 GPU,而國(guó)內(nèi)面向全社會(huì)開(kāi)放服務(wù)的大模型,比如文心一言,據(jù)說(shuō)推理成本也是上一代的8-10倍。

最后說(shuō)說(shuō)算法。

降低大模型對(duì)計(jì)算資源的巨大依賴,一個(gè)主流方案是優(yōu)化模型,在性能不變的基礎(chǔ)上,以更快的推理速度、更小的延遲、更低的資源需求來(lái)運(yùn)行,相當(dāng)于ROI投入產(chǎn)出比更高了,訓(xùn)練、推理環(huán)節(jié)所需要的算力資源,單位成本更低。

有多少人工,就有多少智能,沒(méi)有人才不可能搞出真正能打的大模型。算法開(kāi)發(fā)、測(cè)試、迭代、產(chǎn)品化等,都需要大量技術(shù)人才。人力成本究竟高不高,還要看大模型的商業(yè)模式是否穩(wěn)健。

學(xué)歷拉滿的人才隊(duì)伍,在研發(fā)階段,是相當(dāng)有競(jìng)爭(zhēng)力的。問(wèn)題在于,怎么掙錢呢?API調(diào)用或使用量收費(fèi),一個(gè)token不到一美分,回本盈利可能遙遙無(wú)期;付費(fèi)訂閱(專業(yè)版),頭部大模型具有虹吸效應(yīng),大家都會(huì)選擇OpenAI或BATH等大廠,自家大模型能否被用戶接受并愿意付費(fèi),是未知數(shù);給行業(yè)客戶定制開(kāi)發(fā),ToB要深入了解行業(yè),調(diào)研開(kāi)發(fā)測(cè)試迭代,讓年薪幾十上百萬(wàn)的算法工程師,在工地礦山農(nóng)場(chǎng)一待幾個(gè)月,項(xiàng)目的毛利率估計(jì)不會(huì)太好看。

所以,一個(gè)大模型能不能成功,不僅僅是靠算法本身的能力,還要看從開(kāi)發(fā)到落地的商業(yè)循環(huán)是否可持續(xù)。

管住嘴,邁開(kāi)腿

如果我們把大模型的成本“瘦身”,比作一個(gè)希望減去多余贅肉的人,那么這個(gè)目標(biāo),可以拆解為兩種基本途徑:

一是制造“熱量差”。就是管住嘴邁開(kāi)腿,控制投入,減去多余的成本,加速商業(yè)化提高收入,自然就瘦了。

二是變成“易瘦體質(zhì)”。充分了解大模型的機(jī)理,用新的架構(gòu)來(lái)解決Transformer注意力機(jī)制的問(wèn)題,擁有“怎么吃都不胖”的體質(zhì)。

聽(tīng)起來(lái),第二種是不是非常有誘惑力呢?

不用苦哈哈的控制成本、吸引用戶、定制服務(wù),輕輕松松躺著掙錢,還有這種好事兒?確實(shí)。

目前,所有的大語(yǔ)言模型都用的Transformer架構(gòu),而這種架構(gòu)難以處理長(zhǎng)文本及高分辨率圖像,邏輯推理、知識(shí)歸納等就靠“大力出奇跡”,成本高昂。很多基礎(chǔ)原理仍然不清楚,這就導(dǎo)致很多現(xiàn)存問(wèn)題束手無(wú)策,比如“幻覺(jué)”的產(chǎn)生,推理能力有限等。

圖靈獎(jiǎng)得主 Yann LeCun就不止一次批評(píng)過(guò)大語(yǔ)言模型的技術(shù)范式,認(rèn)為“LLM 對(duì)世界的理解非常膚淺”,他希望構(gòu)建一個(gè)“世界模型”,先學(xué)習(xí)世界運(yùn)作方式,而后形成一個(gè)內(nèi)部模型,再通過(guò)這個(gè)內(nèi)部模型來(lái)完成各種任務(wù)。除此之外,關(guān)于AGI通用智能還有許多科學(xué)家從各自的研究領(lǐng)域去探討。

總結(jié)一下,當(dāng)前的大語(yǔ)言模型,很多原理尚不清晰,技術(shù)仍在變化中。未來(lái)可能會(huì)出現(xiàn)其他技術(shù)范式,顛覆當(dāng)前一味求大的模型,那時(shí)可能就不需要過(guò)高的成本,也就不用痛苦地“瘦身”了。

可能你已經(jīng)發(fā)現(xiàn)了,研究底層的原理、找到一種更強(qiáng)大的AGI技術(shù),這事兒雖然聽(tīng)起來(lái)很酷,但實(shí)在沒(méi)譜,目前還沒(méi)有一個(gè)清晰的時(shí)間表。而這一輪大語(yǔ)言模型的技術(shù)范式,在工程實(shí)踐上是可行的,在產(chǎn)業(yè)中能work的,有提質(zhì)增效的明確效果的。先用起來(lái),把握住現(xiàn)在,才是科技企業(yè)的當(dāng)務(wù)之急。

所以,大模型企業(yè)只能管住嘴、邁開(kāi)腿,盡快控制成本、加速商業(yè)化,制造良性可持續(xù)發(fā)展的“熱量差”。

制造“熱量差”的四化運(yùn)動(dòng)

那么,究竟該怎么制造“熱量差”呢?綜合目前市面上的主流手段,我們將其總結(jié)為“四化運(yùn)動(dòng)”:數(shù)據(jù)規(guī)模化、模型壓縮化、計(jì)算高效化、商業(yè)分層化。

數(shù)據(jù)規(guī)?;?,是通過(guò)規(guī)模效應(yīng),來(lái)提高數(shù)據(jù)的邊際效益,獲得最佳性價(jià)比。規(guī)模效應(yīng)主要通過(guò)三種方式來(lái)實(shí)現(xiàn),一是產(chǎn)業(yè)集中的規(guī)模化,國(guó)家層面已經(jīng)明確提出,要“加快培育數(shù)據(jù)要素市場(chǎng)”,涉及數(shù)據(jù)生產(chǎn)、采集、存儲(chǔ)、加工、分析、服務(wù)等多個(gè)環(huán)節(jié),產(chǎn)業(yè)化有助于減少大模型企業(yè)的數(shù)據(jù)成本。二是AI工具的應(yīng)用,減少數(shù)據(jù)工程各個(gè)環(huán)節(jié)的人工參與,加快預(yù)訓(xùn)練數(shù)據(jù)的處理,為模型訓(xùn)練降本提效。三是反饋數(shù)據(jù)的規(guī)模化。大模型對(duì)微調(diào)數(shù)據(jù)(SFT/RLHF)的需求量和質(zhì)量要求很高,一些更早向全社會(huì)開(kāi)放服務(wù)的大模型,如百度文心一言、商湯“商量SenseChat”、百川智能“百川大模型”、科大訊飛“星火大模型”等,“數(shù)據(jù)飛輪”更早開(kāi)始轉(zhuǎn)動(dòng),有望更快一步達(dá)到邊際效益最優(yōu)的數(shù)據(jù)規(guī)模。

數(shù)據(jù)是有邊際效益的。OpenAl 已經(jīng)可以讓用戶來(lái)決定,是否允許其使用聊天數(shù)據(jù)進(jìn)行訓(xùn)練,也就是說(shuō),可以不再依賴用戶反饋數(shù)據(jù)了,那么數(shù)據(jù)的存儲(chǔ)和計(jì)算成本自然就能控制住了。

模型壓縮化,就是提高模型的性能,以更少的資源實(shí)現(xiàn)更高性能,將資源密集型的大模型,通過(guò)壓縮技術(shù),轉(zhuǎn)化為更加緊湊高效的版本。類似于將脂肪轉(zhuǎn)化為肌肉,肌肉的密度更大,體重(性能)不變,人卻變瘦(更?。┝恕?/p>

目前,大模型壓縮的常見(jiàn)手段,主要有三種:量化、剪枝、知識(shí)蒸餾。

量化,相當(dāng)于抽脂,簡(jiǎn)單粗暴但是有效。模型的精度越高,所需要的存儲(chǔ)空間就越大。但在推理時(shí),其實(shí)并不需要捕捉復(fù)雜模型中十分微小的梯度變化,所以量化可以直接降低模型的參數(shù)精度,“抽”去一部分細(xì)節(jié)性信息,從而減少占用空間,同時(shí)也不過(guò)于降低推理能力。比如以問(wèn)生圖的生成式 AI 模型Stable Diffusion,此前只能在云端運(yùn)行,高通AI Research使用量化技術(shù),讓模型可以在更低精度水平保持準(zhǔn)確性,首次實(shí)現(xiàn)了在 Android 智能手機(jī)上部署 Stable Diffusion。量化技術(shù),也在文心、盤古等國(guó)產(chǎn)大模型中有所應(yīng)用。

剪枝,類似“切除手術(shù)”,直接減去一些對(duì)效果沒(méi)什么影響的旁枝,比如大量冗余的結(jié)構(gòu)、神經(jīng)元,這些權(quán)重較小的部分刪減掉,對(duì)模型效果帶來(lái)的影響不大,也減少了模型的大小。當(dāng)然,剪枝是一門“手藝活兒”,剪枝越精確,給模型準(zhǔn)確率的損失就越小,壓縮效果越好。

知識(shí)蒸餾,就是讓大模型“蒸桑拿”,千億模型一通蒸餾,產(chǎn)出若干個(gè)性能接近、結(jié)構(gòu)更簡(jiǎn)的小模型,落地成本更低。挑戰(zhàn)在于,千億規(guī)模的模型蒸餾,也要消耗極高的計(jì)算資源,而且,從千億蒸餾到幾千萬(wàn),數(shù)據(jù)量差距過(guò)大,容易影響蒸餾的效果。無(wú)損蒸餾,是各大廠商的技術(shù)賽點(diǎn)之一。

既然模型壓縮技術(shù),也會(huì)消耗計(jì)算資源,那么提高算力基礎(chǔ)設(shè)施的計(jì)算效率,就變得格外重要了。

計(jì)算高效化,是大模型廠商能夠以更高效益來(lái)提供模型服務(wù)的前提。

芯片和計(jì)算集群的性能,是研究和優(yōu)化的重點(diǎn)。微軟云azure專門為OpenAI打造了適用于AI計(jì)算的超級(jí)計(jì)算機(jī)。國(guó)內(nèi)廠商,百度、華為都擁有自研芯片、深度學(xué)習(xí)框架,可以通過(guò)端到端優(yōu)化來(lái)提升計(jì)算效率,提升大模型的訓(xùn)練速度和推理速度,從而降低訓(xùn)練時(shí)間和成本。

而對(duì)于產(chǎn)業(yè)大模型、行業(yè)大模型等非通用大模型來(lái)說(shuō),規(guī)模效應(yīng)和硬件優(yōu)化技術(shù)有限,自行構(gòu)建和維護(hù)基礎(chǔ)設(shè)施的成本是非常高的,使用云服務(wù)來(lái)訓(xùn)練和部署服務(wù),是成本更優(yōu)的選擇。

歸根結(jié)底,大模型要提升商業(yè)收入,來(lái)達(dá)到優(yōu)化ROI、回收成本的目的。目前,各類大模型的商業(yè)化,體現(xiàn)出了明顯的分層化特點(diǎn)。

簡(jiǎn)單來(lái)說(shuō),就是不同體量、不同功能、不同方向的大模型,商業(yè)化路徑也開(kāi)始涇渭分明。

通用大模型,以規(guī)模效益、高價(jià)值市場(chǎng),為主要目標(biāo)。OpenAI的用戶量巨大,發(fā)展API經(jīng)濟(jì)具有規(guī)模效應(yīng),前期投入可以隨著業(yè)務(wù)量增長(zhǎng)而被均攤。BATH(百度、阿里、騰訊、華為)等都有各自的云業(yè)務(wù),積累了較為豐富的行業(yè)服務(wù)經(jīng)驗(yàn),尤其是金融、礦山、政務(wù)等大型政企的客戶觸達(dá)能力,具備較大的商業(yè)轉(zhuǎn)化潛力,因此除了面向大眾服務(wù)的訂閱模式、商業(yè)版付費(fèi)模式等,也可以開(kāi)展高價(jià)值的ToB項(xiàng)目定制開(kāi)發(fā)。ToB客戶的高要求推動(dòng)模型體驗(yàn)和效果提升,也可以服務(wù)ToC市場(chǎng),通過(guò)規(guī)?;瘉?lái)進(jìn)一步攤平成本。

行業(yè)大模型,則在主動(dòng)收束產(chǎn)品和業(yè)務(wù)邊界,圍繞核心業(yè)務(wù)和功能,以更少的資源來(lái)開(kāi)發(fā)專精的小模型,在投入和商業(yè)化之間取得一個(gè)很好ROI平衡。比如金融領(lǐng)域,度小滿的“軒轅70B”融入了大量的專業(yè)金融語(yǔ)料,提高對(duì)金融知識(shí)的理解能力,可控性、安全性上滿足金融客戶的特別要求,獲得了上百家金融機(jī)構(gòu)申請(qǐng)?jiān)囉谩?/p>

總而言之,大模型并不是只有通用、泛化一條路,千行百業(yè)的私有化、個(gè)性化部署,會(huì)產(chǎn)生價(jià)格、隱私、安全等多方面的決策因素,也帶來(lái)大量的細(xì)分商機(jī)。通用大模型與行業(yè)大模型、專有小模型,分層+合力打開(kāi)商業(yè)化之路。和而不同,考驗(yàn)著產(chǎn)業(yè)鏈上每一個(gè)角色的智慧。

為了長(zhǎng)遠(yuǎn)、可持續(xù)的服務(wù),管住嘴、邁開(kāi)腿,大模型的“成本瘦身”是必經(jīng)之路。

這個(gè)過(guò)程或許痛苦,卻會(huì)凝練出一條護(hù)城河,守護(hù)整個(gè)行業(yè)的健康發(fā)展。

20世紀(jì)40年代,計(jì)算機(jī)剛剛誕生的時(shí)候,人們驚嘆于這座“機(jī)器怪獸”的龐大身軀,但隨后開(kāi)啟了信息時(shí)代的飛躍。智能手機(jī)剛剛誕生時(shí),功能機(jī)廠商曾對(duì)它極盡諷刺,沒(méi)想到這種人人皆可觸網(wǎng)的普惠聯(lián)接,推起了移動(dòng)互聯(lián)網(wǎng)的繁榮。

隨著大模型越來(lái)越好、成本越來(lái)越低,“人人皆可AI”,也將不再是一個(gè)遙遠(yuǎn)的夢(mèng)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Palm
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    11250
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    135

    瀏覽量

    5944
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    836

    瀏覽量

    14572
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2135

    瀏覽量

    1978
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    3.5元12米運(yùn)動(dòng)感知5.8G雷達(dá)模塊 小體積低成本

    3.5元,支持運(yùn)動(dòng)感應(yīng),體積小巧,應(yīng)用簡(jiǎn)單,感應(yīng)距離壁掛可達(dá)10-12米,大幅度降低智能感應(yīng)燈等產(chǎn)品的生產(chǎn)成本。LD020模塊參數(shù)綠茵場(chǎng)上,球員們已經(jīng)準(zhǔn)備好大展身手
    的頭像 發(fā)表于 07-28 08:38 ?177次閱讀
    3.5元12米<b class='flag-5'>運(yùn)動(dòng)</b>感知5.8G雷達(dá)模塊 小體積低<b class='flag-5'>成本</b>

    AI大模型訓(xùn)練成本飆升,未來(lái)三年或達(dá)千億美元

    在科技日新月異的今天,人工智能(AI)領(lǐng)域的發(fā)展正以前所未有的速度推進(jìn),其中,AI大模型的崛起尤為引人注目。然而,隨著模型參數(shù)的持續(xù)膨脹,其背后的訓(xùn)練成本也呈現(xiàn)出驚人的增長(zhǎng)態(tài)勢(shì)。近日,AI新創(chuàng)公司
    的頭像 發(fā)表于 07-11 15:06 ?364次閱讀

    Anthropic AI模型訓(xùn)練成本飆升,預(yù)計(jì)未來(lái)將達(dá)百億級(jí)

    在人工智能領(lǐng)域的激烈競(jìng)爭(zhēng)中,Anthropic公司以其高昂的研發(fā)投入引發(fā)了廣泛關(guān)注。據(jù)公司CEO達(dá)里奧·阿莫代透露,當(dāng)前正在開(kāi)發(fā)的AI模型訓(xùn)練成本已飆升至驚人的10億美元,這一數(shù)字不僅彰顯了Anthropic在技術(shù)創(chuàng)新上的不遺余力,也預(yù)示著AI研發(fā)
    的頭像 發(fā)表于 07-09 15:38 ?315次閱讀

    工業(yè)元宇宙的仿真可以使用哪些模型

    : 1.1 力學(xué)模型:力學(xué)模型用于模擬物體在力的作用下的運(yùn)動(dòng)。這些模型包括牛頓運(yùn)動(dòng)定律、拉格朗日力學(xué)、哈密頓力學(xué)等。 1.2 熱力學(xué)
    的頭像 發(fā)表于 06-11 10:26 ?363次閱讀

    谷歌Gemini Ultra模型訓(xùn)練成本近2億美元

    斯坦福大學(xué)與研究巨頭Epoch AI聯(lián)合揭示了云計(jì)算時(shí)代下AI模型訓(xùn)練成本的飛速增長(zhǎng)。最新研究結(jié)果顯示,AI巨頭OpenAI的GPT-4訓(xùn)練成本高達(dá)7840萬(wàn)美元,這一數(shù)字令人咋舌。
    的頭像 發(fā)表于 06-07 09:36 ?481次閱讀

    EtherCAT運(yùn)動(dòng)控制器在UVW對(duì)位平臺(tái)中的應(yīng)用

    以ZMC406運(yùn)動(dòng)控制器為例,介紹正運(yùn)動(dòng)UVW三種對(duì)位平臺(tái)機(jī)械手模型與算法的應(yīng)用
    的頭像 發(fā)表于 05-27 11:29 ?694次閱讀
    EtherCAT<b class='flag-5'>運(yùn)動(dòng)</b>控制器在UVW對(duì)位平臺(tái)中的應(yīng)用

    機(jī)器人運(yùn)動(dòng)學(xué)中的非完整約束與運(yùn)動(dòng)模型推導(dǎo)

    機(jī)器人運(yùn)動(dòng)學(xué)中的運(yùn)動(dòng)學(xué)約束是指機(jī)器人在運(yùn)動(dòng)過(guò)程中受到的限制,包括位置、姿態(tài)、速度和加速度等因素。這些約束會(huì)對(duì)機(jī)器人的自由度產(chǎn)生影響,從而影響機(jī)器人的運(yùn)動(dòng)和控制。
    的頭像 發(fā)表于 01-18 16:45 ?1254次閱讀
    機(jī)器人<b class='flag-5'>運(yùn)動(dòng)</b>學(xué)中的非完整約束與<b class='flag-5'>運(yùn)動(dòng)</b><b class='flag-5'>模型</b>推導(dǎo)

    掌握成本計(jì)算:大模型AI應(yīng)用的關(guān)鍵要素

    目前看起來(lái),訓(xùn)練數(shù)據(jù)的質(zhì)量比數(shù)量更重要。對(duì)于大模型廠商來(lái)說(shuō),如何從繁多的數(shù)據(jù)中拿到高質(zhì)量的訓(xùn)練數(shù)據(jù)是他們降低成本的重要工作。
    發(fā)表于 01-17 11:43 ?734次閱讀
    掌握<b class='flag-5'>成本</b>計(jì)算:大<b class='flag-5'>模型</b>AI應(yīng)用的關(guān)鍵要素

    加速度傳感器的基本力學(xué)模型是什么

    加速度傳感器的基本力學(xué)模型是一個(gè)受力物體的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型的組合。本文將從以下幾個(gè)方面介紹加速度傳感器的基本力學(xué)模型。 一、運(yùn)動(dòng)學(xué)
    的頭像 發(fā)表于 01-17 11:08 ?946次閱讀

    存儲(chǔ)空間滿了?學(xué)會(huì)這一招,給設(shè)備瘦瘦身

    故事將相冊(cè)占滿 乍然一看 存儲(chǔ)空間在不知不覺(jué)中變紅 ? 照片又舍不得刪? 還好我們有鐵威馬NAS 把照片上傳到NAS里 就能給電子設(shè)備瘦身啦! ? 也有小伙伴會(huì)覺(jué)得 每次還得登錄TOS系統(tǒng)才能
    的頭像 發(fā)表于 01-05 11:26 ?325次閱讀
    存儲(chǔ)空間滿了?學(xué)會(huì)這一招,給設(shè)備瘦<b class='flag-5'>瘦身</b>

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng)

    。 系統(tǒng)研究與算法開(kāi)發(fā):首先,項(xiàng)目圍繞機(jī)器人的數(shù)學(xué)模型,特別是空間位姿描述和D-H模型展開(kāi)研究。在此基礎(chǔ)上,開(kāi)發(fā)了機(jī)器人的運(yùn)動(dòng)學(xué)正反解算法,使用了雅克比-迭代法等先進(jìn)技術(shù)。此外,還涉及了機(jī)器人任務(wù)空間和關(guān)節(jié)
    發(fā)表于 12-21 20:03

    離子注入仿真用什么模型

    和方法。 離子運(yùn)動(dòng)模型 離子運(yùn)動(dòng)模型是離子注入仿真中最基本的模型之一。它描述了離子在電場(chǎng)和磁場(chǎng)中的運(yùn)動(dòng)
    的頭像 發(fā)表于 12-21 16:38 ?843次閱讀

    基于車輛運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型的橫向控制算法

    ,因此,該方法比較適合應(yīng)用于低速曲率較小的路徑跟蹤控制場(chǎng)景中。 基于運(yùn)動(dòng)學(xué)模型的橫向控制算法中,Pure Pursuit 和 Stanley 前輪反饋算法在中低速場(chǎng)景下,他們的路徑跟蹤的性能較好。 Pure Pursuit 在大的跟蹤誤差和非連續(xù)的路徑場(chǎng)景下魯棒
    的頭像 發(fā)表于 11-15 17:02 ?655次閱讀

    基于車輛運(yùn)動(dòng)學(xué)模型的控制方法

    車輛運(yùn)動(dòng)學(xué)模型 基于車輛運(yùn)動(dòng)學(xué)模型的控制方法主要考慮了車輛的運(yùn)動(dòng)學(xué)約束對(duì)車輛控制的影響。 平時(shí)見(jiàn)到的汽車屬于 阿克曼轉(zhuǎn)向,通??梢院?jiǎn)化為兩輪
    的頭像 發(fā)表于 11-15 16:16 ?446次閱讀
    基于車輛<b class='flag-5'>運(yùn)動(dòng)</b>學(xué)<b class='flag-5'>模型</b>的控制方法

    OpenHarmony應(yīng)用模型的構(gòu)成要素與Stage優(yōu)勢(shì)

    (無(wú)屏設(shè)備可裁剪窗口)。 便于系統(tǒng)擴(kuò)展窗口形態(tài)。 在多設(shè)備(如桌面設(shè)備和移動(dòng)設(shè)備)上,應(yīng)用組件可使用同一套生命周期。 平衡應(yīng)用能力和系統(tǒng)管控成本 Stage模型重新定義應(yīng)用能力的邊界,平衡應(yīng)用能力
    發(fā)表于 09-26 16:48