0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智譜AI領(lǐng)跑司南OpenCompass 2.0月度榜單,GLM-4展示強大實力

獨角獸科技 ? 來源:獨角獸科技 ? 作者:獨角獸科技 ? 2024-05-22 12:44 ? 次閱讀

近期,大模型開源開放評測體系司南(OpenCompass 2.0)公布了2024年4月大語言模型最新評測榜單,智譜AI的GLM-4繼續(xù)保持國產(chǎn)大模型第一的領(lǐng)先身位。

wKgZomZNeAmAOZvZAALVoFD5HAQ911.png

大模型開源開放評測體系司南(OpenCompass 2.0)由上海人工智能實驗室發(fā)布。其月度榜單從基礎(chǔ)能力和綜合能力的設(shè)計出發(fā),構(gòu)建了一套高質(zhì)量的中英文雙語評測基準體系,對主流開源模型和商業(yè)API模型進行了全面評測分析。評測榜單涉及的大語言模型和多模態(tài)大模型超過150個,更有包括Meta、阿里巴巴、騰訊、百度等30余家國內(nèi)外企業(yè)和科研機構(gòu)采用OpenCompass助力開展技術(shù)研發(fā)。

在4月客觀評測榜單中,OpenCompass基于語言、知識、推理、數(shù)學(xué)、代碼、智能體六個維度構(gòu)建了15000余道高質(zhì)量中英文雙語問題,并引入OpenCompass團隊首創(chuàng)的循環(huán)評估 (Circular Evalution) 策略,系統(tǒng)性分析了國內(nèi)外大模型的客觀性能。其中,GLM-4位列第四名,僅次于GPT-4-Turbo系列與Claude3-Opus,成為國內(nèi)大模型客觀評測月度總榜第一名。在語言維度方面,GLM-4分數(shù)達到57.7分表現(xiàn)突出,超過GPT-4-Turbo系列與Claude3-Opus。在知識維度上,GLM-4得到68.9分,超過第二名的GPT-4-Turbo-1106,與第三名Claude3-Opus不相上下。

wKgaomZNeBOAZ63KAAIJ06JMoBs074.png

值得一提的是,GLM-4此前便長期占據(jù)OpenCompass 2.0榜單前列,并多次在權(quán)威榜單與全球頂級大模型一較高下。清華《SuperBench大模型綜合能力評測報告》顯示,GLM-4在語義理解等方面的能力表現(xiàn)超過了GPT-4-Turbo等國際一流模型,在代碼、智能體等方面,排名國內(nèi)第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型測評基準中,GLM-4斬獲一項A+及多項A級評價,在國內(nèi)大模型中排名第一。

據(jù)了解,GLM-4是由智譜AI于今年1月推出的新一代基座大模型。GLM-4整體性能逼近GPT-4,它可以支持更長的上下文,具備更強的多模態(tài)能力。同時,它的推理速度更快,支持更高的并發(fā),大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能體能夠?qū)崿F(xiàn)自主根據(jù)用戶意圖,自動理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。

開發(fā)者可以通過智譜AI大模型開放平臺bigmodel.cn接入GLM-4模型開放API,便捷高效地體驗GLM-4的強大能力。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1461

    瀏覽量

    61488
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266195
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3125

    瀏覽量

    42067
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2134

    瀏覽量

    1971
收藏 人收藏

    評論

    相關(guān)推薦

    AI宣布GLM-4-Flash大模型免費開放

    AI近日宣布了一項重大舉措,其自主研發(fā)的GLM-4-Flash大模型正式向公眾免費開放,用戶可通過智AI大模型開放平臺輕松調(diào)用。這款大
    的頭像 發(fā)表于 08-28 17:41 ?639次閱讀

    智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智glm、通義千問示例)

    接入文心一言、通義千問、豆包、智glm、kimi等國內(nèi)的大模型,這個是必須可以的。但由于各家接口和數(shù)據(jù)格式不一樣,有些朋友直接參考chatgpt的方式?jīng)]有走通,因此本篇以聆思CSK6大模型開發(fā)板接入為
    發(fā)表于 08-21 19:13

    2024世界人工智能大會:智AI引領(lǐng)"智小鎮(zhèn)"新紀元

    在74日至7日的2024世界人工智能大會(WAIC)上,上海世博中心及世博展覽館成為了全球AI科技與創(chuàng)新成果的璀璨舞臺。其中,智AI以其
    的頭像 發(fā)表于 07-04 16:43 ?503次閱讀

    AI發(fā)布全新多模態(tài)開源模型GLM-4-9B

    近日,智AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態(tài)能力,再次刷新了業(yè)界對于大型語言模型的認識。
    的頭像 發(fā)表于 06-07 09:17 ?547次閱讀

    AI推出“AI老羅”,全模型矩陣降價

    在智AI Open Day活動上,科技巨頭智AI宣布了重要進展。備受矚目的羅永浩AI智能體——“AI
    的頭像 發(fā)表于 06-06 09:38 ?423次閱讀

    AI獲沙特基金4億美元投資,估值達30億美元

    近日,沙特阿美石油集團旗下的風(fēng)險投資部門Prosperity7宣布,已參與國內(nèi)知名AI企業(yè)智AI的約4億美元融資。Prosperity7管理著一只高達30億美元的基金,是此次智
    的頭像 發(fā)表于 06-04 14:51 ?593次閱讀

    AI亮相2024 ICLR,分享面向AGI的三大技術(shù)趨勢

    GLM-4的后續(xù)升級版本即GLM-4.5及其升級模型,應(yīng)當(dāng)基于超級認知(Superintelligence)和超級對齊(Superalignment)技術(shù)。
    的頭像 發(fā)表于 05-11 10:29 ?342次閱讀
    智<b class='flag-5'>譜</b><b class='flag-5'>AI</b>亮相2024 ICLR,分享面向AGI的三大技術(shù)趨勢

    官網(wǎng)上線!416日-17日,揭秘百Create大會“AI公開課”

    35日,百Create AI開發(fā)者大會官方網(wǎng)站正式上線。本次大會將于2024年416日至17日在深圳國際會展中心(寶安)舉辦,屆時不僅
    的頭像 發(fā)表于 03-06 15:30 ?789次閱讀

    大模型開源開放評測體系司南正式發(fā)布

    近日,大模型開源開放評測體系司南OpenCompass2.0)正式發(fā)布,旨在為大語言模型、多模態(tài)模型等各類模型提供一站式評測服務(wù)。OpenCompass2.0的發(fā)布,將為模型技術(shù)創(chuàng)新提供重要的技術(shù)支撐。
    的頭像 發(fā)表于 02-05 11:28 ?878次閱讀

    榮登機器之心、胡潤、36氪多個權(quán)威榜單,阿丘科技綜合實力備受認可!

    近日,阿丘科技再獲4項大獎,憑借技術(shù)研發(fā)硬實力與強勁的發(fā)展?jié)摿?,獲得多家專業(yè)媒體與權(quán)威機構(gòu)的肯定。機器之心人工智能領(lǐng)軍企業(yè)TOP20由人工智能領(lǐng)域知名媒體機器之心評選的“「AI中國」機器之心2023
    的頭像 發(fā)表于 01-19 08:24 ?649次閱讀
    榮登機器之心、胡潤、36氪多個權(quán)威<b class='flag-5'>榜單</b>,阿丘科技綜合<b class='flag-5'>實力</b>備受認可!

    AI發(fā)布新一代大模型GLM-4比肩GPT-4

    AI并未止步于技術(shù)層面的創(chuàng)新,他們進一步增強了智能體的能力。此次,智AI正式推出了「GLM-4-All Tools」和「GLMs」個性
    的頭像 發(fā)表于 01-17 16:28 ?1148次閱讀

    AI推出新一代基座大模型GLM-4

    AI近日宣布推出新一代基座大模型GLM-4。這一模型在整體性能上相較上一代實現(xiàn)了大幅提升,其表現(xiàn)已逼近GPT-4。
    的頭像 發(fā)表于 01-17 15:29 ?872次閱讀

    阿丘科技榮獲多項大獎,硬實力創(chuàng)領(lǐng)行業(yè)標桿!

    2023年阿丘科技在AI領(lǐng)域表現(xiàn)卓越,覆蓋行業(yè)及部署落地場景逐步豐富且穩(wěn)定增長;持續(xù)技術(shù)創(chuàng)新,智能相機、AI視覺軟件等多款新品相繼發(fā)布;領(lǐng)跑全國AI工業(yè)質(zhì)檢市場,全方位展現(xiàn)企業(yè)
    的頭像 發(fā)表于 12-20 08:24 ?776次閱讀
    阿丘科技榮獲多項大獎,硬<b class='flag-5'>實力</b>創(chuàng)領(lǐng)行業(yè)標桿!

    引領(lǐng)RISC-V落地,賽昉科技三蟬聯(lián)投中年度銳公司榜單

    的科技創(chuàng)新企業(yè),并以“銳”冠名之。2023年,憑借強大的研發(fā)實力、完善的技術(shù)布局以及堅實的產(chǎn)品落地能力,賽昉科技獲得產(chǎn)業(yè)資本青睞,百戰(zhàn)略投資賽昉科技,雙方還進一步在
    的頭像 發(fā)表于 12-16 08:19 ?383次閱讀
    引領(lǐng)RISC-V落地,賽昉科技三<b class='flag-5'>度</b>蟬聯(lián)投中年度銳公司<b class='flag-5'>榜單</b>

    AI今年累計獲超25億元融資,美團阿里騰訊小米紅杉等參投

    AI專注于制造大模型的自身研究和革新。到2020年,智AI將開始開發(fā)glm事前訓(xùn)練架構(gòu),并訓(xùn)練100億個參數(shù)模型
    的頭像 發(fā)表于 10-20 11:20 ?841次閱讀