0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind AI以總比分 2:0 分別戰(zhàn)勝兩位職業(yè)人類選手

電子工程師 ? 來源:lq ? 2019-01-28 09:30 ? 次閱讀

剛剛,在更復雜的《星際爭霸 II》游戲中,DeepMind AI 以總比分 2:0 分別戰(zhàn)勝兩位職業(yè)人類選手。這或許是自 2017 年 AlphaGo 在圍棋上戰(zhàn)勝人類后,再次讓人類刷新 AI 認知的人機大戰(zhàn)。

此次與人類對戰(zhàn)的 AI 是 AlphaGo 兄弟:AlphaStar。開賽前幾個小時,DeepMind CEO 在 Twitter 上公布了這一名字。而在開賽前一天,DeepMind 宣布 AI 將與人類在《星際爭霸 II》中公開對戰(zhàn)的消息,并表示在《星際爭霸 II》游戲的瘋狂難度模式下,其 AI 的勝率為 50%。

需要說明的是,正如之前打 Dota 的 OpenAI 受到的降低反應速度一樣,DeepMind 此次將 AlphaStar 的反應速度“限制”到 APM 280,大致相當于星際中等職業(yè)玩家的水平。就 AlphaStar 的表現(xiàn)來看,雖然最終在現(xiàn)場 PK 時輸了最后一局比賽,但整體上還是完虐人類。

比賽開始,與 AlphaStar 對戰(zhàn)的第一個職業(yè)選手是 TLO,其世界排名為第 68 位。此次人機大戰(zhàn)是五局三勝制,TLO 雖然不是頂級星際選手,但讓人足夠驚嘆的是,AlphaStar 最終在約五十分鐘內結束戰(zhàn)斗,以 3:0 的成績獲勝,人類職業(yè)選手似乎毫無還手之力。

先來簡單回顧下人機大戰(zhàn)第一場:AlphaStar 第一局一開始就表現(xiàn)的很有全局觀,在 PvP 兩礦打一礦的情況下,TLO 很快被擊??;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再贏一局;十分鐘后,TLO 潰敗給 AlphaStar,有網(wǎng)友說選手太初級,批評 TLO 作為職業(yè)選手在瞎打,沒有尊重熬夜看人機大賽的觀眾。不過,也有人說 AI 很可怕。

如果說第一回合 AlphaStar 戰(zhàn)勝的是“初級”選手,那隨后與其對戰(zhàn)的職業(yè)選手是世界排名第 19 位的 MaNa ,其職業(yè)水平至少是中上游。

上圖顯示的是 AlphaStar 的決策過程,具體比賽過程就不說了,結果是 MaNa 在大約 45 分鐘內連輸五局被 AlphaStar 斬落馬下。

前一個職業(yè)選手 TLO 在 MaNa 輸?shù)舯荣惡蠓Q,“相信我, 和一個像 AlphaStar 這樣的對手比賽是非常困難的, 它的打法和人類完全不同,是你以前從未有過的經(jīng)驗。 AlphaStar 給人留下了極深的印象, 這在游戲 AI 中也是前所未有的。"

AlphaStar 遇神殺神,干脆利落。這次應該沒人責怪 MaNa 打得不好,他顯然拼盡了全力,而網(wǎng)友發(fā)出的慨嘆是希望終結者不會來那么快。

但最后一局讓網(wǎng)友們?yōu)槿祟惷\緊張的情緒稍稍放松,與 MaNa 現(xiàn)場對戰(zhàn)的 AlphaStar 一著不慎,讓 MaNa 扳回一局,但最終以 1:5 輸?shù)舯荣悺?/p>

AlphaStar 的來歷

早在 2016 年,谷歌 DeepMind 的 AI 研究人員已經(jīng)開始關注暴雪娛樂的《星際爭霸 II》。通過游戲來確定 AI 是否可以勝過人類相對簡單的復雜任務是 DeepMind 的研究人員長期以來都在嘗試的項目。同年 11 月,DeepMind 曾在暴雪嘉年華上宣布與暴雪達成合作協(xié)議,將在《星際爭霸》系列游戲中進行合作,將在游戲平臺中引入機器學習方法,進行人工智能研究。

2017 年 8 月,Deepmind 與暴雪共同發(fā)布了合作計劃的首個成果:基于《星際爭霸 II》的人工智能研究環(huán)境 SC2LE,它允許研究者在 Linux 系統(tǒng)中接入游戲 API,開放了 65000 場比賽的數(shù)據(jù)緩存用于訓練 AI,并將添加 50 萬場游戲數(shù)據(jù)到緩存中。

2018 年,同樣在暴雪嘉年華上,他們分享了人工智能模型在《星際爭霸》游戲中的突破。人工智能模型能執(zhí)行基本的宏觀戰(zhàn)略,還能防御像 Tower Rush 這樣的激進戰(zhàn)術。而剛剛結束的“星際爭霸”賽則是是一項“重大挑戰(zhàn)”,因為這要求 AI 智能體“實現(xiàn)和平衡一些子目標”,以便最終擊敗人類選手。

例如,雖然游戲的目標是擊敗對手,但玩家還必須考慮平衡多個子目標,比如收集資源(水晶和氣礦)或建筑。此外,一場比賽的時間通常為幾分鐘到一小時不等,這意味著游戲中提早執(zhí)行的行動會在很長時間不見成效。最后,由于玩家智能看到部分地圖,這意味著智能體必須結合記憶與規(guī)劃才能成功。

AlphaStar 背后的 AI 技術

在圍棋任務中,對手間可以看到整個棋盤,但《星際爭霸 II》與此不同,我們通常無法看到整個地圖,需要派小兵出去偵查。而且游戲是不間斷進行的,整個游戲甚至會有超過 5000 步的操作。

DeepMind 科學家 Oriol Vinyals 曾在去年的一場以《AI 對戰(zhàn)星際爭霸勝算幾何?》的演講中提到,這個游戲基本上就是建造一些建筑物以及單位,在同一個地圖里與不同的組織相互競爭。在這個游戲中,哪怕只是建造建筑物,也需要做出許多決策。除此之外,他們還要不斷收集和利用資源、建造不同的建筑物、不斷擴張,因此整個游戲非常具有挑戰(zhàn)性。

他們在這個游戲中使用的方法依舊是強化學習。他們要讓 AI 模仿人類玩這個游戲的方式,但即使是模仿人類點擊鼠標和敲擊鍵盤的行為也非常困難,需要收集整個《星際爭霸》玩家的行為進行分析。為此還引入了一個游戲引擎。

DeepMind 還為游戲過程設計了不同的指令和模式,這使得整個玩《星際爭霸》的過程變得獨一無二。如今,我們看到的 AlphaStar 正是上述想法的結晶。

現(xiàn)在的 AlphaStar 還是剛出生的嬰幼兒,不過以其極快的進化速度,你也能想到日后的進化版會是多么無可匹敵。到現(xiàn)在,或許還有很多人期待 2 月 15 日 AlphaStar 與世界排名第一的 Serral 進行終極對決,但最終的結果可想而知。正如柯潔輸給 AlphaGo 時面臨的絕望一樣,人類可能不愿意面對這樣的現(xiàn)實:在更多復雜的場景中,人類可能正以難以想象的速度輸給 AI。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266225
  • 機器學習
    +關注

    關注

    66

    文章

    8306

    瀏覽量

    131843
  • DeepMind
    +關注

    關注

    0

    文章

    129

    瀏覽量

    10770

原文標題:2:0!谷歌 AI “AlphaStar“ 虐殺職業(yè)星際玩家

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2TB內置機械硬盤的適用場景有哪些

    給電腦加裝內置硬盤,是實現(xiàn)電腦存儲空間自由立竿見影的一步,尤其是2TB內置機械硬盤,以其充足容量和出色的性價比,是個人用戶和職業(yè)人士儲存海量數(shù)據(jù)的首選。
    的頭像 發(fā)表于 08-30 10:26 ?300次閱讀

    NVIDIA黃仁勛和Meta馬克·扎克伯格探討開源AI的變革潛力

    兩位領導者在 SIGGRAPH 2024 大會上探討開源 AI 的變革潛力,推出 AI Studio,并互換皮夾克。
    的頭像 發(fā)表于 08-13 16:24 ?491次閱讀

    宜科FX20系列分布式I/O再添兩位新成員

    宜科FX20系列分布式I/O再添兩位新成員:四通道IO-Link主站模塊和單通道脈沖輸出模塊。這款功能模塊都是基于對IP20可擴展I/O市場的不同應用場景,為不同的行業(yè)應用帶來更多的I/O解決方案。
    的頭像 發(fā)表于 07-25 15:50 ?369次閱讀

    三菱plcFx2N2AD可以接個壓力傳感器嗎

    個不同壓力點的監(jiān)測和控制。本文將詳細介紹三菱PLC FX2N-2AD接入個壓力傳感器的實現(xiàn)方法和注意事項。 概述 三菱PLC FX2N-2AD具有個模擬輸入通道,
    的頭像 發(fā)表于 06-20 10:13 ?439次閱讀

    LTC2144-14個通道的最低兩位都失效的原因?

    ;b01010101010101到14'b10101010101010之間相互切換。 但是實際調試時發(fā)現(xiàn)一下異常(本人確認引腳連接正常): 1.通道1的最低兩位一直是2‘b11,其余12都正常. 1.通道
    發(fā)表于 05-28 07:39

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌的DeepMind團隊發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環(huán)境
    的頭像 發(fā)表于 03-18 11:39 ?751次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據(jù)報道,谷歌公司的DeepMind團隊近期發(fā)布了AI模型Genie,此模型擁有多達110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當完整的2D游戲場景。
    的頭像 發(fā)表于 02-27 14:53 ?634次閱讀

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾擔任谷歌
    的頭像 發(fā)表于 02-04 10:02 ?633次閱讀

    谷歌DeepMind科學家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?390次閱讀

    奧特曼稱相信AI無法替代人類

    奧特曼稱相信AI無法替代人類 AI對于人類的威脅一直有很多討論,各有不同觀點,很多人對于科幻電影中的場景AI機器人傷害
    的頭像 發(fā)表于 01-19 11:43 ?791次閱讀

    再登Nature!DeepMind大模型突破60年數(shù)學難題,解法超出人類已有認知

    用大模型解決困擾數(shù)學家60多年的問題,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副總裁Pushmeet Kohli表示: 訓練數(shù)據(jù)中不會有這個方案,它之前
    的頭像 發(fā)表于 12-24 21:40 ?456次閱讀
    再登Nature!<b class='flag-5'>DeepMind</b>大模型突破60年數(shù)學難題,解法超出<b class='flag-5'>人類</b>已有認知

    關于AD6688輸出的寬問題

    論壇的大牛們好,我最近在使用AD6688,是一款14的ADC,但是如果配置N=16,CS=0的話,輸出的數(shù)據(jù)會是16的。我本以為是高兩位或低兩位
    發(fā)表于 12-01 07:31

    bigdecimal轉字符串保留兩位小數(shù)

    BigDecimals是Java中用于表示任意精度的十進制數(shù)的類。在許多應用程序中,可能需要將一個BigDecimal轉換為字符串并保留兩位小數(shù)。在本文中,我們將探討如何使用BigDecimal類
    的頭像 發(fā)表于 11-30 11:18 ?3721次閱讀

    S3C2410A GPB端口低兩位與次低兩位個反邏輯LED指示燈的交替閃爍

    各位大神求指導, S3C2410AGPB端口低兩位與次低兩位個反邏輯LED指示燈的交替閃爍,這個當初沒好好學,求指導
    發(fā)表于 11-14 20:22

    單片機串口顯示正常,為什么數(shù)據(jù)統(tǒng)計的數(shù)量少兩位呢?

    單片機串口顯示正常,為什么數(shù)據(jù)統(tǒng)計的數(shù)量少兩位
    發(fā)表于 10-25 06:34