模型表現(xiàn)好,金牌少不了。
剛剛,中文大模型測評基準SuperCLUE發(fā)布《中文大模型基準測評2024年10月報告》:
商湯日日新·商量大模型(SenseChat5.5)憑借出色的能力表現(xiàn),總得分位列國內(nèi)大模型第一梯隊,獲得金牌。
本次SuperCLUE10月報告覆蓋23個國內(nèi)模型,聚焦語言大模型的通用能力評估,分為三大維度:除了考察“文科”、“理科”基礎能力外,還有考察模型更高階能力的“Hard”附加任務,總共2900+道題:
【理科任務】分為計算、邏輯推理、代碼、工具使用測評集;
【文科任務】分為知識百科、語言理解、長文本、角色扮演、生成與創(chuàng)作、安全六大測評集;
【Hard任務】分為精確指令遵循測評集,復雜任務高階推理測評集。
商湯SenseChat5.5在多項評測任務中均位列第一梯隊,文科中語言理解、安全等維度表現(xiàn)突出,也是理科中邏輯推理、代碼學科的“尖子生”。
值得注意的是,在【Hard】的兩項任務——精準指令遵循和高階推理中,商湯SenseChat5.5是唯一兩項任務均位于國內(nèi)第一梯隊的大模型,體現(xiàn)了模型優(yōu)秀的復雜推理智能。
未來,商湯將繼續(xù)堅持基礎大模型的持續(xù)研發(fā)與投入,不斷提升真正高階推理及“慢思考”能力。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
原文標題:近3000道題,商湯大模型拿了金牌
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》,報告選取國內(nèi)外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大
發(fā)表于 09-12 14:41
?528次閱讀
,與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務廠商TOP 3,以顯著的市場份額優(yōu)勢位居GenAI IaaS領(lǐng)域的第一梯隊。
發(fā)表于 07-30 11:00
?681次閱讀
近日,中國電信上海公司公布《產(chǎn)數(shù)開發(fā)代碼助手》項目采購結(jié)果:憑借「日日新」大模型出色的代碼能力,商湯科技中標。由「商湯?小浣熊家族」系列產(chǎn)品團隊提供相關(guān)業(yè)務產(chǎn)品服務支持。
發(fā)表于 07-29 14:25
?479次閱讀
在近期舉辦的世界人工智能大會(WAIC)上,商湯科技攜其流式多模態(tài)交互大模型“日日新SenseNova 5.5”震撼登場,不僅為大會帶來了前所未有的AI體驗,更通過多場主題論壇活動,深入探討了AI大
發(fā)表于 07-08 16:05
?506次閱讀
7月6日,WAIC 2024迎來第三天。 商湯科技全新升級的「日日新SenseNova 5.5」備受熱議,作為國內(nèi)首個具備流式原生多模態(tài)交互能力的大模型,交互效果和多項核心指標實現(xiàn)
發(fā)表于 07-08 15:54
?584次閱讀
商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系,標志著人工智能領(lǐng)域又邁出了堅實的一步。該體系以6000億參數(shù)的超大規(guī)模基礎模型——
發(fā)表于 07-08 15:05
?508次閱讀
商湯科技近日發(fā)布了針對粵語用戶量身定制的商量語言大模型和商量多模態(tài)大模型。這兩款模型即日起向企業(yè)
發(fā)表于 05-31 10:52
?806次閱讀
近日,人工智能領(lǐng)軍企業(yè)商湯科技正式對外發(fā)布了其最新研發(fā)成果——日日新大模型5.0粵語版。該模型針對粵語用戶進行了深度優(yōu)化,旨在提供更精準、更高效的自然語言處理服務。
發(fā)表于 05-30 09:21
?582次閱讀
日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評,結(jié)果顯示在SuperCLUE綜合基準上,
發(fā)表于 05-21 14:45
?677次閱讀
在盛大的“新質(zhì)企業(yè)家聯(lián)合會”成立典禮上,商湯科技副總裁、智慧城市與商業(yè)事業(yè)群總裁張果琲宣布了一項重要消息。商湯科技即將推出日日新大模型5.0
發(fā)表于 05-13 10:58
?538次閱讀
商湯科技即將迎來一項重要更新,他們將發(fā)布日日新大模型5.0的粵語版本。這一版本是基于商湯科技現(xiàn)有
發(fā)表于 05-08 09:33
?448次閱讀
商湯科技近日隆重推出全新升級的“日日新SenseNova 5.0”大模型,其卓越性能贏得了業(yè)界的廣泛贊譽。憑借這一行業(yè)領(lǐng)先的技術(shù)實力,商湯絕
發(fā)表于 05-07 14:13
?521次閱讀
昨日,商湯科技在滬舉辦技術(shù)交流日活動,公布了其“云、端、邊”全棧大模型產(chǎn)品矩陣,并對“日日新SenseNova 5.0”大模型體系進行了全面升級?;诖?,
發(fā)表于 04-24 17:17
?632次閱讀
商湯科技“日日新SenseNova 4.0”正式發(fā)布,標志著大模型體系的一次重大飛躍。該模型在知識覆蓋、推理能力、長文本理解、數(shù)字推理以及代
發(fā)表于 02-05 10:29
?856次閱讀
商湯科技近日發(fā)布了新版的日日新·商量大語言模型-通用版本(SenseChat V4)。這一版本的模型
發(fā)表于 02-04 10:30
?895次閱讀
評論