亚洲午夜福利在线视频,亚洲精品欧美综合,人妻夜夜爽天天爽欧美色院

小模型的風(fēng)潮，最近愈來(lái)愈盛，Mistral和微軟分別有所動(dòng)作。而網(wǎng)友實(shí)測(cè)發(fā)現(xiàn)，Mistral-medium的代碼能力竟然完勝了GPT-4，而所花成本還不到三分之一。

最近，「小語(yǔ)言模型」忽然成為熱點(diǎn)。

本周一，剛剛完成4.15億美元融資的法國(guó)AI初創(chuàng)公司Mistral，發(fā)布了Mixtral 8x7B模型。

這個(gè)開(kāi)源模型盡管尺寸不大，小到足以在一臺(tái)內(nèi)存100GB以上的電腦上運(yùn)行，然而在某些基準(zhǔn)測(cè)試中卻能和GPT-3.5打平，因此迅速在開(kāi)發(fā)者中贏(yíng)得了一片稱(chēng)贊。

之所以叫Mixtral 8x7B，是因?yàn)樗Y(jié)合了為處理特定任務(wù)而訓(xùn)練的各種較小模型，從而提高了運(yùn)行效率。

這種「稀疏專(zhuān)家混合」模型并不容易實(shí)現(xiàn)，據(jù)說(shuō)OpenAI在今年早些時(shí)候因?yàn)闊o(wú)法讓MoE模型正常運(yùn)行，而不得不放棄了模型的開(kāi)發(fā)。

緊接著，就在第二天，微軟又發(fā)布了全新版本的Phi-2小模型。

跟Mistral的70億參數(shù)比，Phi-2小到可以在手機(jī)上跑，只有27億參數(shù)。相比之下，GPT-4的參數(shù)達(dá)到了一萬(wàn)億。

Phi-2在精心挑選的數(shù)據(jù)集上進(jìn)行了訓(xùn)練，數(shù)據(jù)集的質(zhì)量足夠高，因此即使手機(jī)的計(jì)算能力有限，也能確保模型生成準(zhǔn)確的結(jié)果。

雖然還不清楚微軟或其他軟件制造商將如何使用小型模型，但最明顯的好處，就是降低了大規(guī)模運(yùn)行AI應(yīng)用的成本，并且極大地拓寬了生成式AI技術(shù)的應(yīng)用范圍。

這是一件大事。

Mistral-medium代碼生成完勝GPT-4

最近，Mistral-medium已經(jīng)開(kāi)放內(nèi)測(cè)。

有博主對(duì)比了開(kāi)源的Mistral-medium和GPT-4的代碼生成能力，結(jié)果顯示，Mistral-medium比GPT-4的代碼能力更強(qiáng)，然而成本卻只需GPT-4的3成！

總價(jià)來(lái)說(shuō)就是：

1）Mistral會(huì)始終完成工作，完成度很高；

2）不會(huì)在冗長(zhǎng)的解釋性輸出上浪費(fèi)token；

3）提供的建議非常具體。

第一題，「編寫(xiě)用于生成斐波那契素?cái)?shù)的PyTorch數(shù)據(jù)集的cuda優(yōu)化代碼」。

Mistral-Medium生成的代碼嚴(yán)肅、完整。

而GPT-4生成的代碼，就差強(qiáng)人意了。

浪費(fèi)了很多token，卻沒(méi)有輸出有用的信息。

然后，GPT-4只給出了骨架代碼，并沒(méi)有具體的相關(guān)代碼。

第二道題：「編寫(xiě)高效的Python代碼，將大約10億個(gè)大型Apache HTTP訪(fǎng)問(wèn)文件攝取到 SqlLite數(shù)據(jù)庫(kù)中，并使用它來(lái)生成對(duì)sales.html和product.html的訪(fǎng)問(wèn)直方圖」。

Mistral的輸出非常精彩，雖然log不是CSV格式的，但修改起來(lái)很容易。

GPT-4依舊拉跨。

此前，這位博主測(cè)試過(guò)多個(gè)代碼生成模型，GPT-4一直穩(wěn)居第一。

而現(xiàn)在，把它拉下寶座的強(qiáng)勁對(duì)手Mistral-medium終于出現(xiàn)了。

雖然只發(fā)布了兩個(gè)例子，但博主測(cè)試了多個(gè)問(wèn)題，結(jié)果都差不多。

他建議：鑒于Mistral-medium在代碼生成質(zhì)量上有更好的體驗(yàn)，應(yīng)該把它整合到各地的代碼copilot中。

有人按照每1000token算出了輸入和輸出的成本，發(fā)現(xiàn)Mistral-medium比起GPT-4直接降低了70%！

的確，節(jié)省了70%的token費(fèi)用，可不是一件小事。甚至還可以通過(guò)不冗長(zhǎng)的輸出，來(lái)進(jìn)一步節(jié)省成本。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3121

瀏覽量
48663
代碼

代碼

+關(guān)注

關(guān)注
30

文章
4726

瀏覽量
68248
語(yǔ)言模型

語(yǔ)言模型

+關(guān)注

關(guān)注
0

文章
502

瀏覽量
10236

原文標(biāo)題：Mistral攜微軟引爆「小語(yǔ)言模型」潮！Mistral中杯代碼能力完勝GPT-4，成本暴降2/3

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

Llama 3 與 GPT-4 比較

隨著人工智能技術(shù)的飛速發(fā)展，我們見(jiàn)證了一代又一代的AI模型不斷突破界限，為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽中，Llama 3和GPT-4作為兩個(gè)備受矚目的模型，它們代表了當(dāng)前AI領(lǐng)域的最前

發(fā)表于 10-27 14:17 ?254次閱讀

科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

超過(guò)GPT-4 Turbo，數(shù)學(xué)能力和代碼能力更是超過(guò)了Open AI最新一代GPT模型GPT-4

發(fā)表于 10-24 11:39 ?347次閱讀

Mistral Large 2現(xiàn)已在A(yíng)mazon Bedrock中正式可用

。Mistral Large 2是Mistral Large的最新版本，Mistral AI表示其在多語(yǔ)言能力、數(shù)學(xué)、推理、

發(fā)表于 07-26 08:07 ?308次閱讀

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯(cuò)

基于GPT-4的模型——CriticGPT，這款模型專(zhuān)為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì)，其獨(dú)特的作用在于，讓人們能夠用GPT-4來(lái)查找GP

發(fā)表于 06-29 09:55 ?505次閱讀

OpenAI API Key獲?。洪_(kāi)發(fā)人員申請(qǐng)GPT-4 API Key教程

? OpenAI的GPT-4模型因其卓越的自然語(yǔ)言理解和生成能力，成為了許多開(kāi)發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項(xiàng)目，如開(kāi)發(fā)一個(gè)ChatGPT聊天應(yīng)用，不僅是實(shí)踐人工智能技術(shù)

發(fā)表于 06-24 17:40 ?1972次閱讀

開(kāi)發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價(jià)格詳情指南

，高達(dá)每分鐘1000萬(wàn)字符。速度：GPT-4o的速度是GPT-4 Turbo的兩倍。視覺(jué)能力：在視覺(jué)能力相關(guān)的評(píng)估中，

發(fā)表于 05-29 16:00 ?9832次閱讀

OpenAI全新GPT-4o能力炸場(chǎng)！速度快/成本低，能讀懂人類(lèi)情緒

”的意思。GPT-4o文本、推理、編碼能力達(dá)到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的兩倍，但成本僅為

發(fā)表于 05-15 00:15 ?7764次閱讀

阿里云發(fā)布通義千問(wèn)2.5大模型，多項(xiàng)能力超越GPT-4

阿里云隆重推出了通義千問(wèn) 2.5 版，宣稱(chēng)其“技術(shù)進(jìn)步，全面超越GPT-4”，尤其是在中文環(huán)境中的多種任務(wù)（如文本理解、文本生成、知識(shí)問(wèn)答及生活建議、臨時(shí)聊天及對(duì)話(huà)以及安全風(fēng)險(xiǎn)評(píng)估）方面表現(xiàn)出色，超越了GPT-4。

發(fā)表于 05-09 14:17 ?904次閱讀

商湯科技發(fā)布5.0多模態(tài)大模型，綜合能力全面對(duì)標(biāo)GPT-4 Turbo

商湯科技發(fā)布5.0多模態(tài)大模型，綜合能力全面對(duì)標(biāo)GPT-4 Turbo 4月23日，商湯科技董事長(zhǎng)兼CEO徐立在2024商湯技術(shù)交流日上發(fā)布了行業(yè)首個(gè)云、端、邊全棧大模型產(chǎn)品矩陣，能夠滿(mǎn)足不同規(guī)模

發(fā)表于 04-24 16:49 ?1043次閱讀

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

起初，Copilot作為Bing Chat AI助手推出，初期采用GPT-3.5模型，隨后升級(jí)至GPT-4取得顯著進(jìn)步，如今再次更新至性能卓越的GPT-4 Turbo模型，這無(wú)疑將使得Copilot功能再上新臺(tái)階。

發(fā)表于 03-13 13:42 ?663次閱讀

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹(shù)立AI新標(biāo)桿

近日，AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型，該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能，成功擊敗了此前被廣泛認(rèn)為是全球最強(qiáng)AI模型的GPT-4，樹(shù)立了新的行業(yè)基準(zhǔn)。

發(fā)表于 03-05 09:49 ?619次閱讀

ChatGPT plus有什么功能？OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能分析解答在最近的OpenAI DevDay上，該組織發(fā)布了一項(xiàng)備受期待的公告：推出GPT-4 Turbo，這是對(duì)其突破性AI模型

發(fā)表于 12-13 09:19 ?1048次閱讀

AI觀(guān)察 | 今年最火的GPT-4，正在締造科幻版妙手仁心！

近來(lái)，微軟對(duì)于提示工程能力的最新研究 1 （鏈接詳見(jiàn)文末）再次吸引了一眾媒體的目光：“無(wú)需額外微調(diào)、無(wú)需專(zhuān)業(yè)策劃，僅憑提示GPT-4就能化身專(zhuān)家！”報(bào)道中這樣描述道 2 。基于最新提

發(fā)表于 12-11 08:15 ?448次閱讀

新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini，原生多模態(tài)碾壓GPT-4？

谷歌背水一戰(zhàn)，發(fā)布Gemini，狙擊GPT-4

發(fā)表于 12-08 09:09 ?1086次閱讀

OpenAI發(fā)布的GPT-4 Turbo版本ChatGPT plus有什么功能？

OpenAI的GPT-4 Turbo以前所未有的功能和價(jià)格改變?nèi)斯ぶ悄艿奈磥?lái) 在人工智能領(lǐng)域的一次里程碑式活動(dòng)中，OpenAI開(kāi)發(fā)者大會(huì)上發(fā)布了GPT-4 Turbo，這是突破性人工智能模型

發(fā)表于 12-05 17:57 ?2369次閱讀