0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯日日新·商量大模型位列國內(nèi)大模型第一梯隊

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2024-11-08 15:38 ? 次閱讀

模型表現(xiàn)好,金牌少不了。

剛剛,中文大模型測評基準SuperCLUE發(fā)布《中文大模型基準測評2024年10月報告》:

商湯日日新·商量大模型(SenseChat5.5)憑借出色的能力表現(xiàn),總得分位列國內(nèi)大模型第一梯隊,獲得金牌。

本次SuperCLUE10月報告覆蓋23個國內(nèi)模型,聚焦語言大模型的通用能力評估,分為三大維度:除了考察“文科”、“理科”基礎能力外,還有考察模型更高階能力的“Hard”附加任務,總共2900+道題:

【理科任務】分為計算、邏輯推理、代碼、工具使用測評集;

【文科任務】分為知識百科、語言理解、長文本、角色扮演、生成與創(chuàng)作、安全六大測評集;

【Hard任務】分為精確指令遵循測評集,復雜任務高階推理測評集。

商湯SenseChat5.5在多項評測任務中均位列第一梯隊,文科中語言理解、安全等維度表現(xiàn)突出,也是理科中邏輯推理、代碼學科的“尖子生”。

值得注意的是,在【Hard】的兩項任務——精準指令遵循和高階推理中,商湯SenseChat5.5是唯一兩項任務均位于國內(nèi)第一梯隊的大模型,體現(xiàn)了模型優(yōu)秀的復雜推理智能

未來,商湯將繼續(xù)堅持基礎大模型的持續(xù)研發(fā)與投入,不斷提升真正高階推理及“慢思考”能力。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 商湯科技
    +關(guān)注

    關(guān)注

    8

    文章

    489

    瀏覽量

    36037
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2273

    瀏覽量

    2350

原文標題:近3000道題,商湯大模型拿了金牌

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    云知聲山海大模型位居全球大模型第一梯隊

    SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》,報告選取國內(nèi)外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大
    的頭像 發(fā)表于 09-12 14:41 ?528次閱讀

    GenAI IaaS增速驚人,商湯科技躋身第一梯隊

    ,與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務廠商TOP 3,以顯著的市場份額優(yōu)勢位居GenAI IaaS領(lǐng)域的第一梯隊。
    的頭像 發(fā)表于 07-30 11:00 ?681次閱讀
    GenAI IaaS增速驚人,<b class='flag-5'>商湯</b>科技躋身<b class='flag-5'>第一梯隊</b>

    商湯日日新模型中標上海電信訂單

    近日,中國電信上海公司公布《產(chǎn)數(shù)開發(fā)代碼助手》項目采購結(jié)果:憑借「日日新」大模型出色的代碼能力,商湯科技中標。由「商湯?小浣熊家族」系列產(chǎn)品團隊提供相關(guān)業(yè)務產(chǎn)品服務支持。
    的頭像 發(fā)表于 07-29 14:25 ?479次閱讀

    商湯科技&quot;日日新SenseNova 5.5&quot;大模型閃耀WAIC,引領(lǐng)AI新紀元

    在近期舉辦的世界人工智能大會(WAIC)上,商湯科技攜其流式多模態(tài)交互大模型日日新SenseNova 5.5”震撼登場,不僅為大會帶來了前所未有的AI體驗,更通過多場主題論壇活動,深入探討了AI大
    的頭像 發(fā)表于 07-08 16:05 ?506次閱讀

    商湯日日新”大模型全面賦能2024 WAIC

    7月6日,WAIC 2024迎來第三天。 商湯科技全新升級的「日日新SenseNova 5.5」備受熱議,作為國內(nèi)首個具備流式原生多模態(tài)交互能力的大模型,交互效果和多項核心指標實現(xiàn)
    的頭像 發(fā)表于 07-08 15:54 ?584次閱讀

    商湯科技發(fā)布日日新5.5大模型體系

    商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系,標志著人工智能領(lǐng)域又邁出了堅實的步。該體系以6000億參數(shù)的超大規(guī)模基礎模型——
    的頭像 發(fā)表于 07-08 15:05 ?508次閱讀

    商湯科技發(fā)布“商量”粵語版大模型

    商湯科技近日發(fā)布了針對粵語用戶量身定制的商量語言大模型商量多模態(tài)大模型。這兩款模型即日起向企業(yè)
    的頭像 發(fā)表于 05-31 10:52 ?806次閱讀

    商湯發(fā)布日日新模型5.0粵語版

    近日,人工智能領(lǐng)軍企業(yè)商湯科技正式對外發(fā)布了其最新研發(fā)成果——日日新模型5.0粵語版。該模型針對粵語用戶進行了深度優(yōu)化,旨在提供更精準、更高效的自然語言處理服務。
    的頭像 發(fā)表于 05-30 09:21 ?582次閱讀

    中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內(nèi)最好成績

    日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評,結(jié)果顯示在SuperCLUE綜合基準上,
    的頭像 發(fā)表于 05-21 14:45 ?677次閱讀
    中文大<b class='flag-5'>模型</b>測評基準SuperCLUE:<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>5.0,刷新<b class='flag-5'>國內(nèi)</b>最好成績

    商湯科技即將推出日日新模型5.0粵語版本

    在盛大的“新質(zhì)企業(yè)家聯(lián)合會”成立典禮上,商湯科技副總裁、智慧城市與商業(yè)事業(yè)群總裁張果琲宣布了項重要消息。商湯科技即將推出日日新模型5.0
    的頭像 發(fā)表于 05-13 10:58 ?538次閱讀

    商湯將發(fā)布日日新模型5.0粵語版本

    商湯科技即將迎來項重要更新,他們將發(fā)布日日新模型5.0的粵語版本。這版本是基于商湯科技現(xiàn)有
    的頭像 發(fā)表于 05-08 09:33 ?448次閱讀

    商湯科技發(fā)布“日日新SenseNova 5.0”大模型

    商湯科技近日隆重推出全新升級的“日日新SenseNova 5.0”大模型,其卓越性能贏得了業(yè)界的廣泛贊譽。憑借這行業(yè)領(lǐng)先的技術(shù)實力,商湯
    的頭像 發(fā)表于 05-07 14:13 ?521次閱讀

    商湯科技新升級大模型,對標GPT-4 Turbo?

    昨日,商湯科技在滬舉辦技術(shù)交流日活動,公布了其“云、端、邊”全棧大模型產(chǎn)品矩陣,并對“日日新SenseNova 5.0”大模型體系進行了全面升級?;诖?,
    的頭像 發(fā)表于 04-24 17:17 ?632次閱讀

    商湯日日新SensNova 4.0發(fā)布

    商湯科技“日日新SenseNova 4.0”正式發(fā)布,標志著大模型體系的次重大飛躍。該模型在知識覆蓋、推理能力、長文本理解、數(shù)字推理以及代
    的頭像 發(fā)表于 02-05 10:29 ?856次閱讀

    商湯科技發(fā)布新版日日新·商量大語言模型

    商湯科技近日發(fā)布了新版的日日新·商量大語言模型-通用版本(SenseChat V4)。這版本的模型
    的頭像 發(fā)表于 02-04 10:30 ?895次閱讀