0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mistral發(fā)布Mistral Large旗艦?zāi)P?,但沒(méi)有開(kāi)源

甲子光年 ? 來(lái)源:甲子光年 ? 2024-02-27 13:34 ? 次閱讀

昨夜,被稱(chēng)為“法國(guó)版 OpenAI”的 Mistral AI 再放大招,正式發(fā)布 Mistral Large 旗艦?zāi)P?,并且推出?duì)標(biāo) ChatGPT 的對(duì)話產(chǎn)品:Le Chat,直接殺到 OpenAI 家門(mén)口。

就在 Mistral Large 發(fā)布前幾個(gè)小時(shí),全球市值第一的微軟宣布與 Mistral AI 達(dá)成深度合作。未來(lái),Mistral AI 將獲得 OpenAI 同等待遇,直接將模型資源放在微軟云當(dāng)中售賣(mài),成為第二家在微軟 Azure 云平臺(tái)上提供商業(yè) AI 模型的公司

據(jù)Mistral AI CEO Arthur Mensch 透露,開(kāi)發(fā)這款新模型的成本不到 2000 萬(wàn)歐元(約合 2200 萬(wàn)美元)。

另外據(jù)外媒報(bào)道,微軟收購(gòu)了少數(shù) MistralAI的股權(quán),這意味著在投資 OpenAI 之后,Mistral AI 成為微軟投資的第二家大模型公司。

但是,作為開(kāi)源公司出道的 Mistral AI ,并沒(méi)有將這款新旗艦?zāi)P烷_(kāi)源。對(duì)此,埃隆·馬斯克評(píng)價(jià)道:“微軟是否讓它們成為閉源代碼?”

Mistral AI 是否走上了 OpenAI 開(kāi)源再閉源的老路?

1.Mistral Large 性能直逼 GPT-4

據(jù)官方新聞稿介紹,Mistral Large 是 Mistral AI 的最新旗艦版,達(dá)到了頂級(jí)的推理能力。它可以用于復(fù)雜的多語(yǔ)言推理任務(wù),包括文本理解、轉(zhuǎn)換和代碼生成。

在常用基準(zhǔn)測(cè)試上 Mistral Large 表現(xiàn)強(qiáng)勁,以 81.2% 的成績(jī)超越了Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B 四款模型,僅次于 GPT-4。

10cfef04-d52f-11ee-a297-92fbcf53809c.png

在MMLU(測(cè)量大規(guī)模多任務(wù)語(yǔ)言理解)上,GPT-4、Mistral Large(預(yù)訓(xùn)練)、Claude 2、Gemini Pro 1.0、GPT 3.5和LLaMA 2 70B的比較。

Mistral Large 具有以下特點(diǎn):

它在英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、德語(yǔ)和意大利語(yǔ)方面具有天然的流利度,對(duì)語(yǔ)法和文化背景有細(xì)膩的理解。

它的 32K token 上下文窗口允許從大型文檔中精確地回憶信息。

它精確的指令遵循能力使開(kāi)發(fā)者能夠設(shè)計(jì)他們的審核政策——Mistral AI 用它來(lái)設(shè)置 Le Chat 的系統(tǒng)級(jí)審核。

它天然具備函數(shù)調(diào)用能力。這一點(diǎn),加上在 la Plateforme 上實(shí)施的受限輸出模式,使得應(yīng)用開(kāi)發(fā)和技術(shù)?,F(xiàn)代化能夠規(guī)?;M(jìn)行。

和常用基準(zhǔn)測(cè)試上的頂級(jí) LLM 模型相比,Mistral Large 也表現(xiàn)不俗。

推理和知識(shí)

10ded866-d52f-11ee-a297-92fbcf53809c.png

市場(chǎng)上頂級(jí)LLM模型在廣泛常識(shí)、推理和知識(shí)基準(zhǔn)測(cè)試上的性能:MMLU(測(cè)量大規(guī)模多任務(wù)語(yǔ)言理解)、HellaSwag(10-shot)、Wino Grande(5-shot )、Arc Challenge(5-shot)、Arc Challenge(25-shot)、TriviaQA(55-shot)和TruthfulQA。

多語(yǔ)言能力

Mistral Large 還是一個(gè)語(yǔ)言方面的“多面手”。在法語(yǔ)、德語(yǔ)、西班牙語(yǔ)和意大利語(yǔ)的 HellaSwag、Arc Challenge 和MMLU 基準(zhǔn)測(cè)試中,它的表現(xiàn)遠(yuǎn)遠(yuǎn)超過(guò) LLaMA 2 70B。

1101161a-d52f-11ee-a297-92fbcf53809c.png

在法語(yǔ)、德語(yǔ)、西班牙語(yǔ)和意大利語(yǔ)的HellaSwag、Arc Challenge和MMLU上,Mistral Large、Mixtral 8x7B和LLaMA 2 70B的比較。

數(shù)學(xué)和編碼

Mistral Large 不僅有強(qiáng)大的語(yǔ)言天賦,數(shù)學(xué)和編碼所代表的邏輯能力也很強(qiáng)。

1117c2f2-d52f-11ee-a297-92fbcf53809c.png

市場(chǎng)上領(lǐng)先LLM模型在流行的編碼和數(shù)學(xué)基準(zhǔn)測(cè)試上的性能:HumanEval pass@1、MBPP pass@1、Math maj@4、GSM8K maj@8(8-shot )和GSM8K maj@1(5-shot )。

這次和 Mistral Large 一起面世的,還有一個(gè)更“小而美”的 Mistral Small。Mistral Small 的性能超過(guò) Mixtral 8x7B,并且延遲更低,這使它成為開(kāi)放權(quán)重產(chǎn)品和旗艦?zāi)P椭g的一個(gè)精細(xì)的中間解決方案。

Mistral Small 和 Mistral Large 在 RAG 啟用和函數(shù)調(diào)用方面都有相同的創(chuàng)新。

目前,開(kāi)發(fā)者可從兩個(gè)渠道獲取Mistral AI:

La Plateforme:在歐洲的 Mistral 基礎(chǔ)設(shè)施上安全托管,這個(gè)接入點(diǎn)使開(kāi)發(fā)者能夠在全面的模型范圍內(nèi)創(chuàng)建應(yīng)用和服務(wù)。

Azure:Mistral Large 可以通過(guò) Azure AI Studio 和 Azure Machine Learning 獲得,用戶體驗(yàn)與 API 一樣無(wú)縫。Beta 客戶已經(jīng)成功使用了它。

自我部署:Mistral Large 環(huán)境上部署,并且可以訪問(wèn)模型權(quán)重。

Mistral Large 在 Azure AI 上的定價(jià)如下:輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定價(jià)為:輸出為 0.03 美元/1000 token,輸入 0.01 美元/ 1000 token。

此外,Mistral AI 還還發(fā)布了首個(gè)對(duì)標(biāo) ChatGPT 的對(duì)話助手 Le Chat,該助手可以在后臺(tái)使用 Mistral Large 或 Mistral Small,或者一個(gè)名為 Mistral Next 的原型模型;并發(fā)布了面向企業(yè)的 Le Chat Enterprise。 值得注意的是,Le Chat 目前還不支持聯(lián)網(wǎng)功能。

2.Mistral AI 與 OpenAI 相爭(zhēng),微軟成最大贏家 ?

Mistral AI 創(chuàng)始人 Guillaume Lample 在X上官宣 Mistral Large 后,圖靈獎(jiǎng)獲得者、Meta 首席科學(xué)家 Yann LeCun(楊立昆)一改往日對(duì) OpenAI 的苛刻態(tài)度,第一時(shí)間發(fā)來(lái)祝賀

還有熱心網(wǎng)友向楊立昆發(fā)來(lái)關(guān)切,并鼓勵(lì)其發(fā)布完全開(kāi)源的 LLama 3。

對(duì)此,楊立昆則希望網(wǎng)友多點(diǎn)耐心。

事實(shí)上,Mistral AI 這個(gè)成立不到 10 個(gè)月的年輕團(tuán)隊(duì)大有扭轉(zhuǎn)局面的氣勢(shì)。

Mistral AI 公司成立于 2023 年 5 月,總部位于法國(guó)巴黎,以一己之力將 LLM 的聚光燈從中美的主戰(zhàn)場(chǎng)拉向了歐洲。

Mistral AI 是開(kāi)源、小模型領(lǐng)域的“先鋒”選手。

Mistral AI 在 2023 年 9 月推出開(kāi)源的 7B 模型,發(fā)布時(shí)間晚于 LLama 2,但并未被 LLama 2 搶了風(fēng)頭。其越級(jí)達(dá)到了大部分模型 20B 左右的水平,實(shí)際使用時(shí)進(jìn)一步微調(diào)的表現(xiàn)也比其他模型更容易學(xué)到領(lǐng)域?qū)S弥R(shí),得到很多開(kāi)源和企業(yè)使用者的認(rèn)可。

Mistral 創(chuàng)始團(tuán)隊(duì)以年輕科學(xué)家為主,其中 7 人來(lái)自 Meta(4位是 Llama 的參與者),3人來(lái)自 Hugging Face,2人來(lái) Deepmind;之前領(lǐng)導(dǎo)過(guò) Llama 1&2、Flamingo(Google DeepMind 論文,GPT-4V 外最重要的多模態(tài)模型)、Chinchilla(Google DeepMind 論文,建立了模型數(shù)據(jù)與參數(shù)量的標(biāo)準(zhǔn))、RETRO(Google DeepMind 論文,第一個(gè)結(jié)合 Retrieval 和 LLM 的大模型)、BLOOM(Llama 1 出現(xiàn)前的最重要開(kāi)源模型)等重要模型。

Mistral AI 的管理層一共四人。

其中,CEO Arthur Mensch 來(lái)自 Deepmind,參與了 Deepmind 的多個(gè)經(jīng)典的模型:Flamingo、Chinchilla、Gopher。

CTO 和 首席科學(xué)家分別是 Llama & Llama2 的核心工程、研究角色(由于離職,并未在 Llama2 論文中體現(xiàn))。Chief Business Officer Florian 則由創(chuàng)始顧問(wèn),Alan 的 CEO 推薦加入。

目前,Mistral 已完成了三輪公開(kāi)融資,總額超過(guò)6億美元。

2023 年 6 月,公司完成 1.05 億歐元(約合 1.13 億美元)的種子輪融資,由 Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投,投后估值 2.4 億歐元;

2023 年 12 月,Mistral 完成由 Andreessen Horowitz(a16z)領(lǐng)投,英偉達(dá)、Salesforce、法國(guó)巴黎銀行、美國(guó)風(fēng)投機(jī)構(gòu) General Catalyst 等投資的 3.85 億歐元(約合 4.15 億美元)融資。

2024 年 2 月,微軟入股 Mistral。

據(jù)悉,Mistral公司估值已超過(guò)20億歐元(約合156.2億元人民幣),成為 AI 領(lǐng)域的獨(dú)角獸公司

自成立以來(lái),Mistral AI 便被認(rèn)為是 OpenAI 有力的競(jìng)爭(zhēng)對(duì)手,并一直堅(jiān)定站在 OpenAI 的“反面——OpenAI 閉源,Mistral AI 開(kāi)源;OpenAI 堅(jiān)定地走“大數(shù)據(jù)+大算力+大規(guī)模參數(shù)”的暴力美學(xué)路徑,Mistral AI 則掀起一輪“小模型”熱潮,在 7B 規(guī)模下不斷再創(chuàng)輝煌。

不過(guò),在OpenAIMistralAI的較量中,微軟或成最大的贏家,將兩條路線均收入囊中。

此次,微軟與 Mistral AI 的合作重點(diǎn)關(guān)注三個(gè)核心領(lǐng)域:

超級(jí)計(jì)算基礎(chǔ)設(shè)施:微軟將通過(guò) Azure AI 超級(jí)計(jì)算基礎(chǔ)設(shè)施來(lái)支持 Mistral AI,為 Mistral AI 旗艦?zāi)P偷?AI 訓(xùn)練和推理工作負(fù)載提供一流的性能和規(guī)模。

擴(kuò)展到市場(chǎng):微軟和 Mistral AI 將通過(guò)Azure AI Studio和Azure 機(jī)器學(xué)習(xí)模型目錄中的模型即服務(wù) (MaaS) 向客戶提供 Mistral AI 的高級(jí)模型。除了 OpenAI 模型之外,模型目錄還提供開(kāi)源和商業(yè)模型的多種選擇。開(kāi)發(fā)者可使用 Microsoft Azure 消費(fèi)承諾 (MACC)來(lái)購(gòu)買(mǎi) Mistral AI 的模型。Azure 的 AI 優(yōu)化基礎(chǔ)設(shè)施和企業(yè)級(jí)功能為 Mistral AI 提供了向全球 Microsoft 客戶推廣、銷(xiāo)售和分發(fā)其模型的額外機(jī)會(huì)。

人工智能研究和開(kāi)發(fā):微軟和 Mistral AI 將探索圍繞為特定客戶(包括歐洲公共部門(mén)工作負(fù)載)培訓(xùn)特定目的模型的合作。

此外,據(jù)英國(guó)《金融時(shí)報(bào)》報(bào)道,微軟對(duì)Mistral AI進(jìn)行了小額投資,但不持有該公司任何股權(quán)。


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1033

    瀏覽量

    6378
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1546

    瀏覽量

    7356
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    264

    瀏覽量

    297

原文標(biāo)題:Mistral獲微軟投資,發(fā)布旗艦?zāi)P蚆istral Large,但沒(méi)有開(kāi)源|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    騰訊發(fā)布開(kāi)源MoE大語(yǔ)言模型Hunyuan-Large

    近日,騰訊公司宣布成功推出業(yè)界領(lǐng)先的開(kāi)源MoE(Mixture of Experts,專(zhuān)家混合)大語(yǔ)言模型——Hunyuan-Large。這款模型不僅在參數(shù)量上刷新了業(yè)界紀(jì)錄,更在效果
    的頭像 發(fā)表于 11-06 10:57 ?197次閱讀

    Mistral AI與NVIDIA推出全新語(yǔ)言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語(yǔ)言模型Mistral NeMo 12B。開(kāi)發(fā)者可以輕松定制和部署該模型
    的頭像 發(fā)表于 07-27 11:04 ?608次閱讀

    Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

    北京2024年7月25日 /美通社/ -- 亞馬遜云科技宣布,Mistral AI的Mistral Large 2(24.07)基礎(chǔ)模型(FM)現(xiàn)已在Amazon Bedrock中正式
    的頭像 發(fā)表于 07-26 08:07 ?305次閱讀

    微軟與人工智能公司Mistral AI的合作案免于英國(guó)反壟斷調(diào)查

    今年2月底,Microsoft宣布聯(lián)手被譽(yù)為“歐洲OpenAI”的法國(guó)初創(chuàng)企業(yè)Mistral AI。雙方達(dá)成協(xié)議,Microsoft將投資20億歐元(約合157億元人民幣)助力Mistral AI開(kāi)拓全球市場(chǎng),并在Azure云計(jì)算平臺(tái)上提供其大型語(yǔ)言
    的頭像 發(fā)表于 05-18 11:49 ?300次閱讀

    Mistral AI將達(dá)成約6億美元融資協(xié)議

    法國(guó)AI領(lǐng)域的佼佼者Mistral AI近日宣布,即將完成一筆高達(dá)6億美元的融資協(xié)議。此輪融資不僅將Mistral AI的估值推高至60億美元,更是其歷史性的突破。
    的頭像 發(fā)表于 05-11 10:15 ?331次閱讀

    Mistral AI發(fā)布1760億參數(shù)開(kāi)源模型Mixtral 8x22B,兼容Torrent

    作為一家備受矚目的新興AI企業(yè),Mistral AI因其“6人團(tuán)隊(duì),7頁(yè)P(yáng)PT,8億融資”的傳奇故事而聲名遠(yuǎn)揚(yáng)。尤其值得一提的是,該公司曾獲得微軟投資,使之順利駛?cè)敫咚侔l(fā)展軌道。
    的頭像 發(fā)表于 04-11 14:34 ?660次閱讀

    Mistral Large模型現(xiàn)已在Amazon Bedrock上正式可用

    Mistral AI的Mistral Large模型現(xiàn)已在Amazon Bedrock上正式可用。今年三月,亞馬遜云科技在Amazon Bedrock上引入了法國(guó)先鋒AI初創(chuàng)企業(yè)
    的頭像 發(fā)表于 04-08 16:26 ?501次閱讀

    微軟與Mistral AI建立長(zhǎng)期合作關(guān)系

    微軟攜手人工智能領(lǐng)軍者Mistral AI,正式宣布建立長(zhǎng)期戰(zhàn)略合作關(guān)系,共同邁向AI領(lǐng)域的新高峰。雙方的合作將聚焦在超級(jí)計(jì)算基礎(chǔ)設(shè)施、市場(chǎng)推廣規(guī)模及AI研發(fā)三大核心領(lǐng)域,力求實(shí)現(xiàn)共贏發(fā)展。
    的頭像 發(fā)表于 03-22 09:37 ?451次閱讀

    IBM在watsonx上提供開(kāi)源Mistral AI模型

    上最新的開(kāi)源模型,watsonx 提供企業(yè)就緒的人工智能開(kāi)發(fā)平臺(tái)、數(shù)據(jù)存儲(chǔ)和治理功能 IBM(紐約證券交易所代碼:IBM)近日宣布,由 Mistral AI 公司開(kāi)發(fā)的廣受歡迎的開(kāi)源
    的頭像 發(fā)表于 03-12 19:10 ?1297次閱讀

    Microsoft和Mistral AI宣布建立新的合作伙伴關(guān)系 加速AI創(chuàng)新

    微軟與人工智能領(lǐng)域領(lǐng)先者Mistral AI宣布建立長(zhǎng)期合作關(guān)系,共同推動(dòng)AI發(fā)展。
    的頭像 發(fā)表于 03-12 09:11 ?493次閱讀

    微軟與Mistral達(dá)成繼OpenAI后的第二筆人工智能交易

    微軟宣布與價(jià)值20億歐元(約21億美元)的法國(guó)人工智能初創(chuàng)公司Mistral建立新的多年合作關(guān)系。
    的頭像 發(fā)表于 03-06 16:43 ?602次閱讀

    Mistral AI發(fā)布旗艦模型Mistral Large及聊天機(jī)器人Le Chat

    近日,歐洲人工智能領(lǐng)域的領(lǐng)軍企業(yè)Mistral AI發(fā)布了其旗艦模型Mistral Large
    的頭像 發(fā)表于 03-04 14:04 ?792次閱讀

    微軟攜手法國(guó)AI初創(chuàng)企業(yè)Mistral推動(dòng)AI模型商業(yè)化

    微軟近日與法國(guó)人工智能初創(chuàng)企業(yè)Mistral達(dá)成合作協(xié)議,旨在推動(dòng)AI模型的商業(yè)化應(yīng)用。據(jù)悉,微軟將提供全方位支持,幫助這家成立僅10個(gè)月的公司將其先進(jìn)的AI模型推向市場(chǎng)。同時(shí),微軟還將持有M
    的頭像 發(fā)表于 02-28 10:23 ?480次閱讀

    微軟21億美元投資法國(guó)AI公司Mistral AI

    微軟近日宣布向法國(guó)人工智能公司Mistral AI注資20億歐元(約合21億美元),以推動(dòng)生成式人工智能領(lǐng)域的發(fā)展。此舉不僅加強(qiáng)了微軟在全球AI領(lǐng)域的布局,也為Mistral AI帶來(lái)了前所未有的商業(yè)機(jī)遇。
    的頭像 發(fā)表于 02-28 10:08 ?421次閱讀

    開(kāi)源AI模型全新飛躍,深空激光傳輸革新里程碑

    大家好,歡迎收看河套 IT WALK 第 130 期。 法國(guó)創(chuàng)業(yè)公司 Mistral AI 作出一項(xiàng)承諾:2024年,它將推出一款開(kāi)源的 GPT-4 級(jí)模型;而 NASA 則實(shí)現(xiàn)了深空視頻的激光傳輸
    的頭像 發(fā)表于 12-20 19:45 ?446次閱讀
    <b class='flag-5'>開(kāi)源</b>AI<b class='flag-5'>模型</b>全新飛躍,深空激光傳輸革新里程碑