0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型醫(yī)療專業(yè)能力全球第一

云知聲 ? 來源:云知聲 ? 2024-09-19 15:47 ? 次閱讀

近日,由上海AI實驗室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,繼4月份奪冠后,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)再次以綜合得分82.2的優(yōu)異成績位列全球第一,各項指標(biāo)全面超越GPT-4,充分展現(xiàn)出山海大模型在擁有業(yè)內(nèi)一流的通用能力之外,更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

MedBench致力于打造一個科學(xué)、公平且嚴(yán)謹(jǐn)?shù)闹形尼t(yī)療大模型評測體系及開放平臺,其基于醫(yī)學(xué)權(quán)威標(biāo)準(zhǔn),不斷更新維護高質(zhì)量的醫(yī)學(xué)數(shù)據(jù)集,全方位多維度量化模型在各個醫(yī)學(xué)維度的能力。

MedBench的五大評測維度——醫(yī)學(xué)語言理解、醫(yī)學(xué)語言生成、醫(yī)學(xué)知識問答、復(fù)雜醫(yī)學(xué)推理、醫(yī)療安全和倫理,構(gòu)成了其專業(yè)評測框架的核心。這一框架吸納了海量醫(yī)學(xué)知識庫和醫(yī)院醫(yī)學(xué)專家的豐富經(jīng)驗,涵蓋8個公開數(shù)據(jù)集和12個自建數(shù)據(jù)集,總計約30萬道中文醫(yī)療專業(yè)測評題目,覆蓋了從醫(yī)學(xué)考試題庫到患者服務(wù)、醫(yī)學(xué)問診、病例分析以及病歷生成等廣泛的醫(yī)學(xué)任務(wù),致力為中文醫(yī)療大模型提供客觀科學(xué)的性能評測參考。

今年5月,MedBench平臺全面升級,不僅引入API評測方式,豐富了參評途徑,還優(yōu)化了開放域問答的評估指標(biāo)。通過醫(yī)學(xué)專家的精準(zhǔn)標(biāo)注,平臺進一步提升了評測結(jié)果的公正性和專業(yè)性。同時,平臺在數(shù)據(jù)集、評測方法和系統(tǒng)功能等方面也進行了升級,旨在為醫(yī)療大模型評測構(gòu)建一個更加完善的社區(qū)環(huán)境,并提供更加豐富、真實的實踐場景。

此次評測,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)通過API提交方式,不僅以82.2的綜合得分刷新了MedBench評測記錄,更是在各個維度上力壓GPT-4,排名全球第一。這一成績的取得,是山海大模型醫(yī)療專業(yè)能力的集中展現(xiàn),也標(biāo)志著其技術(shù)迭代和創(chuàng)新發(fā)展達(dá)到了一個新的高度。

目前,山海大模型通用能力已超越GPT-3.5,并在SuperCLUE 4月評測中躋身國內(nèi)大模型Top10;與GPT-4的對戰(zhàn)中,山海綜合勝率與和率為75.55%。

在醫(yī)療專業(yè)能力上,山海大模型于2023年6月的MedQA任務(wù)中超越Med-PaLM 2,取得87.1%的優(yōu)異成績;在臨床執(zhí)業(yè)醫(yī)師資格考試中以523分(總分600分)的優(yōu)異成績,超過99%的考生水平;其基于山海大模型孵化的醫(yī)療行業(yè)版大模型,也在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎。

隨著醫(yī)療行業(yè)對智能化、精準(zhǔn)化服務(wù)需求的不斷增長,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)有望在醫(yī)療健康領(lǐng)域扮演更加關(guān)鍵的角色,為提升醫(yī)療服務(wù)效率、優(yōu)化患者體驗、推動醫(yī)療科技進步提供強有力的支持。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 醫(yī)療
    +關(guān)注

    關(guān)注

    8

    文章

    1790

    瀏覽量

    58626
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    163

    瀏覽量

    8351
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2274

    瀏覽量

    2356

原文標(biāo)題:MedBench最新評測:山海大模型醫(yī)療專業(yè)能力全球第一,各項指標(biāo)力壓GPT-4

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    山海模型多項能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個具有代表性的大模型,結(jié)果顯示,山海模型對齊、智能體、安全等多項
    的頭像 發(fā)表于 10-12 14:30 ?337次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項<b class='flag-5'>能力</b><b class='flag-5'>全球</b>領(lǐng)跑

    山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

    近日,多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單,山海多模態(tài)大模型UniGPT-mMed
    的頭像 發(fā)表于 10-12 14:09 ?233次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

    山海模型助力司法領(lǐng)域智慧化升級

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?547次閱讀

    山海模型位居全球模型第一梯隊

    SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024上半年報告》,報告選取國內(nèi)外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大模型發(fā)展現(xiàn)狀進行觀察與思考。
    的頭像 發(fā)表于 09-12 14:41 ?528次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨運的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?343次閱讀

    在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

    解決的課題。 2024高工智能汽車開發(fā)者大會暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來智能座艙交互新體驗》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?767次閱讀

    說話人識別引擎獲得HUAWEI COMPATIBLE證書及認(rèn)證徽標(biāo)的使用權(quán)

    山海模型獲得兩項華為昇騰技術(shù)認(rèn)證后,近日,經(jīng)華為綜合評測,說話人識別引擎成功通過與華為Atlas 800 推理服務(wù)器(型號:300
    的頭像 發(fā)表于 05-27 18:12 ?722次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>說話人識別引擎獲得HUAWEI COMPATIBLE證書及認(rèn)證徽標(biāo)的使用權(quán)

    攜手耘途教育成立學(xué)院福建分院

    近日,與耘途教育攜手,共同成立了學(xué)院福建分院,此舉標(biāo)志著雙方在智慧教育領(lǐng)域展開了深度合作。根據(jù)合作協(xié)議,
    的頭像 發(fā)表于 05-13 10:38 ?367次閱讀

    山海模型醫(yī)療行業(yè)版登頂上海AI實驗室權(quán)威大模型評測榜

    近日,上海AI實驗室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,山海模型醫(yī)療
    的頭像 發(fā)表于 04-24 14:28 ?1781次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b><b class='flag-5'>醫(yī)療</b>行業(yè)版登頂上海AI實驗室權(quán)威大<b class='flag-5'>模型</b>評測榜

    山海模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?653次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡稱)再次更新了其招股書,繼續(xù)穩(wěn)步推進其在
    的頭像 發(fā)表于 03-22 14:42 ?638次閱讀

    再闖港股IPO,深耕AI領(lǐng)域

    近日,智能科技股份有限公司(簡稱:)正式向港交所遞交了招股書,計劃主板IPO上市。這
    的頭像 發(fā)表于 03-19 15:36 ?754次閱讀

    山海模型獲得華為昇騰技術(shù)認(rèn)證

    山海模型近日取得了重大突破,順利通過了華為Atlas 800訓(xùn)練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這
    的頭像 發(fā)表于 02-05 09:32 ?937次閱讀

    全新推出AIGC內(nèi)容創(chuàng)作平臺藍(lán)藻AI

    近日,基于智能語音技術(shù)和山海模型技術(shù),全新推出AIGC內(nèi)容創(chuàng)作平臺——藍(lán)藻AI,為創(chuàng)作者提供AI聲音克隆、AI文字配音、AI文案創(chuàng)作
    的頭像 發(fā)表于 01-10 13:38 ?747次閱讀

    推動醫(yī)療產(chǎn)業(yè)數(shù)字化智能化發(fā)展

    由億歐大健康主辦的CHS 2023第八屆中國大健康產(chǎn)業(yè)升級峰會在北京成功召開,活動現(xiàn)場發(fā)布“CHS 2023中國大健康產(chǎn)業(yè)榜”系列榜單。憑借在醫(yī)療領(lǐng)域的大模型實踐探索,
    的頭像 發(fā)表于 12-25 17:23 ?761次閱讀