0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀

近日,科技公司谷歌和微軟相繼在一份權(quán)威自然語言理解榜單中超越人類的表現(xiàn),微軟宣稱這“標志著邁向通用人工智能的重要里程碑?!?/p>

自然語言理解(Natural Language Understanding,簡稱NLU)任務在人工智能領域歷史悠久,被譽為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實現(xiàn)高質(zhì)量的自然語言理解有相當?shù)碾y度。

為了衡量人工智能模型的自然語言理解能力,紐約大學、華盛頓大學、Facebook和DeepMind在2019年合作提出一個名為SuperGLUE的人工智能基準測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準線(human baseline)。這是人工智能首次在SuperGLUE中表現(xiàn)超越人類。

盡管在SuperGLUE測試上取得令人滿意的結(jié)果,但微軟坦言,DeBERTa模型還沒有達到人類智能的自然語言理解水平。人類非常善于利用從不同任務中學到的知識來解決新的任務,這是AI模型需要學習的地方。

排名第一的微軟模型DeBERTa共有15億個參數(shù)。在SuperGLUE測試中,單個DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(xiàn)(89.8分);模型整體得分(90.3分)也超過人類基準線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個孩子對疾病產(chǎn)生了免疫力”,問“這是由什么導致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個簡單的因果推理任務,人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰(zhàn)。為了得出正確答案,模型需要理解已知條件和選項之間的因果關系。

2021年1月6日,微軟在博客發(fā)文詳細介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個基于Transformer架構(gòu)的神經(jīng)語言模型,采用自監(jiān)督學習方法對大量原始文本語料庫進行預訓練。DeBERTa的目標是學習通用的語言表達形式,適用于各種自然語言理解任務。DeBERTa主要用到三種新技術,分別是分離注意力機制、增強的掩碼解碼器和用于微調(diào)的虛擬對抗訓練方法。

排名第二的T5+Meena技術來自谷歌。谷歌團隊尚未詳細解釋其模型在SuperGLUE創(chuàng)紀錄的原因。但微軟在博客文章中評價稱,谷歌的T5模型由110億個參數(shù)組成,相比之下,15億參數(shù)的DeBERTa在訓練和維護上更加節(jié)能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準備向公眾公開15億參數(shù)的DeBERTa模型及其源代碼。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6516

    瀏覽量

    103599
  • 人工智能
    +關注

    關注

    1787

    文章

    46060

    瀏覽量

    234951
  • 自然語言
    +關注

    關注

    1

    文章

    279

    瀏覽量

    13295
收藏 人收藏

    評論

    相關推薦

    AI模型MCU的應用

    機遇。將AI模型集成到MCU,不僅提升了設備的智能化水平,還使得設備能夠執(zhí)行更復雜的任務,實現(xiàn)自主決策和實時響應。本文將從AI模型
    的頭像 發(fā)表于 07-12 10:24 ?589次閱讀

    微軟、谷歌等科技巨頭承諾安全開發(fā)AI模型

    近日,微軟、谷歌、OpenAI等16家科技巨頭“人工智能(AI)首爾峰會”上達成共識,承諾AI
    的頭像 發(fā)表于 05-22 11:25 ?429次閱讀

    微軟將推出自研AI模型

    微軟正在緊鑼密鼓地訓練一款全新的自研人工智能大模型——“MAI-1”。據(jù)悉,這款模型規(guī)模龐大,足以與谷歌的Gemini和OpenAI的ChatGPT相媲美。
    的頭像 發(fā)表于 05-13 11:30 ?582次閱讀

    新火種AI|正面硬剛OpenAI與谷歌?微軟竟然偷偷自研出5000億參數(shù)大模型

    AI領域,微軟公司一直以其獨到的創(chuàng)新性和前瞻性而聞名。也正因此,它搶先在AI賽道嗅到商機,并極具預判性的投資了OpenAI,使其成為自己
    的頭像 發(fā)表于 05-11 11:47 ?480次閱讀
    新火種<b class='flag-5'>AI</b>|正面硬剛OpenAI與<b class='flag-5'>谷歌</b>?<b class='flag-5'>微軟</b>竟然偷偷自研出5000億參數(shù)大<b class='flag-5'>模型</b>!

    微軟準備推出新的AI模型谷歌及OpenAI競爭

    據(jù)報道,微軟向OpenAI投資超過100億美元后,首次成功訓練了一個名為“MAI-1”的內(nèi)部人工智能模型。這一模型規(guī)模龐大,足以與
    的頭像 發(fā)表于 05-08 10:45 ?458次閱讀

    微軟準備推出全新人工智能語言模型

    微軟近期傳出消息,正在秘密研發(fā)一款全新的人工智能語言模型,這款模型規(guī)模上預計將具備與谷歌和OpenAI等業(yè)界巨頭相抗衡的實力。據(jù)悉,這款新
    的頭像 發(fā)表于 05-08 09:30 ?348次閱讀

    微軟自研AI模型即將問世

    微軟正悄然醞釀一項重大技術突破,據(jù)內(nèi)部消息人士透露,公司正全力訓練一款名為“MAI-1”的自研人工智能大模型。這款模型備受期待,其規(guī)模龐大,足以與谷歌的Gemini和OpenAI的Ch
    的頭像 發(fā)表于 05-07 14:46 ?390次閱讀

    微軟MSN天氣服務引入全新AI模型

    微軟天氣預測領域取得了突破性的進展,為MSN天氣服務引入了全新的AI預測模型。該模型微軟St
    的頭像 發(fā)表于 05-07 09:25 ?412次閱讀

    世界數(shù)字技術院發(fā)布:生成式AI安全測試標準及大語言模型

    據(jù)悉,上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業(yè),其中,
    的頭像 發(fā)表于 04-17 16:51 ?840次閱讀

    微軟將在PowerToys運用本地AI模型優(yōu)化粘貼功能

    據(jù)微軟官方宣布,Build 2024開發(fā)者大會上,公司將升級PowerToys,增加基于本地AI模型的高級粘貼功能。
    的頭像 發(fā)表于 04-11 11:37 ?262次閱讀

    谷歌發(fā)布全新AI基礎世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界
    的頭像 發(fā)表于 03-04 14:02 ?595次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以谷歌的官方網(wǎng)站或相關的開發(fā)者平臺上找到。具體地,您可以嘗試訪問谷歌AI
    的頭像 發(fā)表于 03-01 18:13 ?1437次閱讀

    谷歌AI模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌AI
    的頭像 發(fā)表于 02-28 18:12 ?982次閱讀

    谷歌發(fā)布開源AI模型Gemma

    近日,谷歌發(fā)布了全新AI模型Gemma,這款模型為各種規(guī)模的組織提供了前所未有的機會,以負責任的方式商業(yè)應用中進行分發(fā)。
    的頭像 發(fā)表于 02-28 17:38 ?714次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎架構(gòu),旨在實現(xiàn)視頻
    的頭像 發(fā)表于 02-04 13:49 ?864次閱讀