0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind圍棋吊打世界冠軍

Qp2m_ggservicer ? 來源:cg ? 2018-12-10 16:00 ? 次閱讀

作為 AlphaGo 的最新迭代,DeepMind 又在 11 月 6 日發(fā)表的《科學》(Science)論文中,隆重介紹了 AlphaZero 。作為谷歌母公司 Alphabet 旗下的英國人工智能子公司,DeepMind 多年來一直致力于改進 Go AI 。2017 年的時候,前 AI 冠軍 AlphaGo 正式退休,但在進一步修補之后,AlphaZero 又達到了新的頂峰。

AlphaZero 是一款能夠從頭學習圍棋、象棋等棋子游戲的新型人工智能平臺。在三款棋類比賽中,AlphaZero 將三款 AI 都挑落下馬。

● Stockfish:國際象棋 AI 世界冠軍;

● elmo:2017 年度世界計算機將棋錦標賽冠軍;

● AlphaGo Zero:DeepMind 自家的圍棋 AI,被譽為史上最強選手。

在僅僅獲知有關(guān)游戲基本規(guī)則的情況下,AlphaZero 在成為人工智能大師之前,會先自己機型數(shù)百萬場的對抗練習。

該 AI 初期會實施隨機戰(zhàn)術(shù)來取得勝利,但后續(xù)會通過‘強化學習’來試錯,以逐步了解哪些策略是最有效的。

實測國際象棋需要 9 小時、將棋 12 小時、圍棋 13 天,涉及 5000 個張量處理單元(TPU)。

作為參考,一套 TPU 每天可以處理超過 Google Photos 中的 1 億+照片,所以 AlphaZero 對硬件處理性能的要求還是比較高的。

o4YBAFwOHQCAX_fhAAZKDpZ4_gU990.gif

閉關(guān)學習結(jié)束后,AlphaZero 就可以大殺四方了

這項研究的獨特之處在于,研究團隊將機器學習算法、與蒙特卡羅樹(MCTS)的“搜索方法”結(jié)合到了一塊。

這是 Go 圍棋 AI 決定下一步行動所采用的方式,這次 DeepMind 團隊在國際象棋和將棋 AI 上也套用了同樣的機制,首次展示了該方法適用于其它復雜的游戲測試。

對于人類國際象棋選手來說,AlphaZero 是極具吸引力的。你可以在與機器對戰(zhàn)時,見識到此前從未遇到過的策略、以及一些新穎的想法。

其咄咄逼人的風格、以及高度動態(tài)的應變策略,足以讓 Matthew Sadler 之類的國際象棋大師感到驚訝(其在 DeepMind 博客上有所表述)。

有關(guān)這項研究的詳情,已經(jīng)發(fā)表在近日出版的《科學》(Science)期刊上。原標題為:《A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play》《一種通用的強化學習算法,可自學成為國際象棋、將棋、圍棋大師》。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104353
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    129

    瀏覽量

    10770

原文標題:GGAI 前沿 | 谷歌DeepMind超級進化:國際象棋、圍棋吊打世界冠軍

文章出處:【微信號:ggservicerobot,微信公眾號:高工智能未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。
    的頭像 發(fā)表于 07-16 18:29 ?469次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>DeepMind</b>被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領域發(fā)揮巨大作用。
    的頭像 發(fā)表于 05-10 11:26 ?459次閱讀

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發(fā)AI模型,這一創(chuàng)新技術(shù)將為科學家們提供前所未有的幫助,使他們能更精確地理解疾病機制,進而開發(fā)出更高效的治療藥物。
    的頭像 發(fā)表于 05-10 09:35 ?312次閱讀

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌DeepMind團隊發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環(huán)境
    的頭像 發(fā)表于 03-18 11:39 ?751次閱讀

    谷歌發(fā)布全新AI基礎世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界中逐
    的頭像 發(fā)表于 03-04 14:02 ?596次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌DeepMind團隊開發(fā)的一款大型語言模型,
    的頭像 發(fā)表于 03-01 16:20 ?459次閱讀

    谷歌發(fā)布基礎世界模型Genie,世界模型領域競爭升溫

    繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。據(jù)谷歌官網(wǎng)介紹,Genie是一個基于互聯(lián)網(wǎng)視頻訓練的基礎世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可
    的頭像 發(fā)表于 02-28 18:20 ?1297次閱讀

    谷歌DeepMind重磅發(fā)布了基礎世界模型:Genie(精靈)

    大家都喜歡玩游戲吧?因為游戲最大的吸引力是讓我們逃避現(xiàn)實、幻想一個遠離我們眼前現(xiàn)實的世界,掌控這個虛擬的現(xiàn)實世界?,F(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。
    的頭像 發(fā)表于 02-28 10:45 ?734次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>DeepMind</b>重磅發(fā)布了基礎<b class='flag-5'>世界</b>模型:Genie(精靈)

    谷歌公布基礎模型Genie,主攻2D平臺類游戲及機器人應用

    DeepMind指出,Genie有能力根據(jù)最新的文生圖大模型生成初始幀,再借助Genie的能力賦予這些圖像更深層次的含義。Genie作為一個包含110億參數(shù)的基礎世界模型,成功研發(fā)得益于谷歌聲名在外的潛在動作模型
    的頭像 發(fā)表于 02-28 10:02 ?377次閱讀

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據(jù)報道,谷歌公司的DeepMind團隊近期發(fā)布了AI模型Genie,此模型擁有多達110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當完整的2D游戲場景。
    的頭像 發(fā)表于 02-27 14:53 ?633次閱讀

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾擔任谷歌
    的頭像 發(fā)表于 02-04 10:02 ?632次閱讀

    谷歌DeepMind科學家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?390次閱讀

    谷歌AlphaGeometry系統(tǒng)已接近頂尖學生水平

    谷歌的人工智能部門再次證明了其卓越的技術(shù)實力,這次推出的AlphaGeometry系統(tǒng)在解決幾何問題上的能力已經(jīng)達到了接近頂尖學生的水平。這一系統(tǒng)由谷歌DeepMind開發(fā),其在解決幾何問題上的出色表現(xiàn)幾乎與
    的頭像 發(fā)表于 01-19 15:44 ?480次閱讀

    再登Nature!DeepMind大模型突破60年數(shù)學難題,解法超出人類已有認知

    用大模型解決困擾數(shù)學家60多年的問題,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副總裁Pushmeet Kohli表示: 訓練數(shù)據(jù)中不會有這個
    的頭像 發(fā)表于 12-24 21:40 ?456次閱讀
    再登Nature!<b class='flag-5'>DeepMind</b>大模型突破60年數(shù)學難題,解法超出人類已有認知