0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智源研究院揭曉大模型測(cè)評(píng)結(jié)果,豆包與百川智能大模型表現(xiàn)優(yōu)異

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-05-20 09:26 ? 次閱讀

5月18日,北京智源研究院發(fā)布了關(guān)于國內(nèi)外各類開/閉源語言及多模態(tài)大模型性能評(píng)估的最新研究成果。此項(xiàng)研究覆蓋了140余個(gè)語言模型的綜合實(shí)力對(duì)比,包括其對(duì)中文文本理解和多模態(tài)圖文問答等任務(wù)的處理能力。

研究發(fā)現(xiàn),盡管國內(nèi)頭部語言模型在中文環(huán)境中的整體表現(xiàn)已接近國際一流水平,但仍存在能力發(fā)展不平衡的問題。

在多模態(tài)理解圖文問答任務(wù)中,開源和閉源模型表現(xiàn)相當(dāng),而國產(chǎn)模型則表現(xiàn)出色。此外,在中文語境下的文生圖能力方面,國產(chǎn)多模態(tài)模型與國際一流水平的差距相對(duì)較小。

具體到語言模型的排名,在中文語境下,字節(jié)跳動(dòng)的豆包Skylark2以及OpenAI的GPT-4分別名列第一和第二。值得注意的是,國產(chǎn)大模型在理解中國用戶需求方面具有明顯優(yōu)勢(shì)。

在語言模型客觀評(píng)價(jià)中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同時(shí),百度的文心一言4.0、智譜華章的GLM-4以及月之暗面的Kimi也躋身語言模型主客觀評(píng)價(jià)的前五名。

在多模態(tài)理解模型的客觀評(píng)價(jià)中,圖文問答方面,阿里巴巴的通義Qwen-vl-max和上海人工智能實(shí)驗(yàn)室的InternVL-Chat-V1.5在某些指標(biāo)上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能實(shí)驗(yàn)室的Intern-XComposer2-VL-7B緊隨其后。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3215

    瀏覽量

    42328
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3112

    瀏覽量

    48660
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2274

    瀏覽量

    2357
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    百川智能發(fā)布一站式大模型商業(yè)化解決方案

    近日,百川智能正式推出了一站式大模型商業(yè)化解決方案,旨在為企業(yè)提供更加全面、高效的大模型應(yīng)用服務(wù)。該解決方案以1+3產(chǎn)品矩陣為核心,包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Tu
    的頭像 發(fā)表于 11-01 18:01 ?695次閱讀

    【附實(shí)操視頻】聆思CSK6大模型開發(fā)板接入國內(nèi)主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)

    輸出的結(jié)果進(jìn)行語音合成實(shí)現(xiàn)端側(cè)播報(bào)。 目前已經(jīng)接通文心一言、豆包、kimi、智譜glm、通義千問等國內(nèi)主流大模型,詳細(xì)模板和操作步驟可以參考附件文檔。
    發(fā)表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智譜glm、通義千問示例)

    本帖最后由 jf_40317719 于 2024-8-21 19:17 編輯 多模態(tài)交互離不開硬件載體,近期有不少開發(fā)者在研究聆思CSK6大模型開發(fā)板除了使用出廠示例自帶的星火大模型,能不能
    發(fā)表于 08-21 19:13

    摩爾線程攜手智研究院完成基于Triton的大模型算子庫適配

    近日,摩爾線程與北京智人工智能研究院(簡稱:智研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾
    的頭像 發(fā)表于 08-02 11:06 ?734次閱讀

    模型廠商“輸血”不斷,百川智能完成50億元A輪融資!

    有重磅消息曝出:知名大模型公司百川智能已經(jīng)成功收獲了價(jià)值50億元的A輪融資。由此,我們不禁感嘆,大模型廠商們的“輸血”和“續(xù)命”之戰(zhàn),還在激烈的上演著。
    的頭像 發(fā)表于 07-31 14:47 ?562次閱讀
    大<b class='flag-5'>模型</b>廠商“輸血”不斷,<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成50億元A輪融資!

    百川智能完成50億元A輪融資

    近日,國內(nèi)領(lǐng)先的醫(yī)療AI大模型企業(yè)——百川智能,正式宣布完成了高達(dá)50億元人民幣的A輪融資,這一里程碑式的融資不僅彰顯了市場(chǎng)對(duì)其技術(shù)實(shí)力與未來發(fā)展?jié)摿Φ母叨日J(rèn)可,也為公司的后續(xù)發(fā)展奠定了堅(jiān)實(shí)的資金基礎(chǔ)。
    的頭像 發(fā)表于 07-26 16:42 ?419次閱讀

    亞馬遜云科技接入百川智能和零一萬物基礎(chǔ)模型

    近日,亞馬遜云科技在中國峰會(huì)上宣布,兩大中文基礎(chǔ)模型——百川智能的Baichuan2-7B和零一萬物的Yi-1.5 6B/9B/34B,即將或已正式登陸中國區(qū)域的SageMaker JumpStart。這一舉措為中國企業(yè)提供了豐
    的頭像 發(fā)表于 06-04 11:53 ?540次閱讀

    百川智能發(fā)布Baichuan 4大模型及首款A(yù)I助手“小應(yīng)”

    百川智能近日發(fā)布了其新一代基座大模型Baichuan 4,并同步推出了首款A(yù)I助手“小應(yīng)”。這款A(yù)I助手是在Baichuan 4強(qiáng)大能力的基礎(chǔ)上,結(jié)合先進(jìn)的搜索技術(shù)精心打造而成。
    的頭像 發(fā)表于 05-23 14:15 ?564次閱讀

    百川智能與北京大學(xué)將共建通用人工智能聯(lián)合實(shí)驗(yàn)室

    近日,百川智能與北京大學(xué)攜手合作,共同簽署了“北大——百川通用人工智能聯(lián)合實(shí)驗(yàn)室”的共建協(xié)議,標(biāo)志著雙方在人工智能領(lǐng)域邁出了堅(jiān)實(shí)的合作步伐。
    的頭像 發(fā)表于 03-21 11:45 ?835次閱讀

    數(shù)勢(shì)聯(lián)動(dòng)百川,發(fā)布首批大模型聯(lián)合解決方案,推動(dòng)中國大模型價(jià)值落地

    近日,行業(yè)領(lǐng)先的數(shù)據(jù)智能產(chǎn)品提供商北京數(shù)勢(shì)云創(chuàng)科技有限公司(以下簡稱“數(shù)勢(shì)科技”)和國內(nèi)通用大模型廠商北京百川智能科技有限公司(以下簡稱“百川
    的頭像 發(fā)表于 02-28 11:40 ?447次閱讀
    數(shù)勢(shì)聯(lián)動(dòng)<b class='flag-5'>百川</b>,發(fā)布首批大<b class='flag-5'>模型</b>聯(lián)合解決方案,推動(dòng)中國大<b class='flag-5'>模型</b>價(jià)值落地

    百川智能發(fā)布超千億大模型Baichuan 3

    百川智能近日發(fā)布了超千億參數(shù)的大語言模型Baichuan 3,引發(fā)了業(yè)界的廣泛關(guān)注。這款模型在多個(gè)權(quán)威通用能力評(píng)測(cè)中表現(xiàn)卓越,展現(xiàn)了其強(qiáng)大的
    的頭像 發(fā)表于 01-31 14:58 ?772次閱讀

    搜索出生的百川智能模型RAG爬坑之路總結(jié)

    今天對(duì)百川的RAG方法進(jìn)行解讀,百川智能具有深厚的搜索背景,來看看他們是怎么爬RAG的坑的吧~
    的頭像 發(fā)表于 01-05 15:02 ?1413次閱讀
    搜索出生的<b class='flag-5'>百川</b><b class='flag-5'>智能</b>大<b class='flag-5'>模型</b>RAG爬坑之路總結(jié)

    百川智能發(fā)布Baichuan2 Turbo系列API,或?qū)⑻娲袠I(yè)大模型

    在當(dāng)天的媒體溝通會(huì)上,百川智能創(chuàng)始人、CEO王小,百川智能聯(lián)合創(chuàng)始人、聯(lián)席總裁洪濤,百川
    的頭像 發(fā)表于 12-20 16:54 ?895次閱讀

    天數(shù)智芯支持智研究院首次完成大模型異構(gòu)算力混合訓(xùn)練,突破異構(gòu)算力束縛

    11 月 29 日,北京智人工智能研究院副院長兼總工程師林詠華在 2023 人工智能計(jì)算大會(huì)上宣布,正式開源 700 億參數(shù)大模型 Aqu
    的頭像 發(fā)表于 11-30 13:10 ?3214次閱讀
    天數(shù)智芯支持智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>首次完成大<b class='flag-5'>模型</b>異構(gòu)算力混合訓(xùn)練,突破異構(gòu)算力束縛

    新華社研究院:商湯“商量”獲評(píng)中國大模型市場(chǎng)未來領(lǐng)袖

    SenseChat ” 在定量實(shí)測(cè)的情商維度上,位居全部10款大模型第一 , 并在定性評(píng)估中入選大模型市場(chǎng)未來領(lǐng)袖象限 。此外,商湯賦能電力AI平臺(tái)智能化升級(jí)的實(shí)踐,也入圍新華社研究院
    的頭像 發(fā)表于 11-29 18:30 ?472次閱讀
    新華社<b class='flag-5'>研究院</b>:商湯“商量”獲評(píng)中國大<b class='flag-5'>模型</b>市場(chǎng)未來領(lǐng)袖