国产一区二区三区免费视频在线播放,久久婷婷五月综合色首页,国产日韩视频一区二区三区

DeepMind 公司因?yàn)檠兄瞥鰰?huì)下棋的人工智能AlphaGo和AlphaZero而聲名鵲起，如今他們將注意力轉(zhuǎn)向了另一種棋盤游戲：強(qiáng)權(quán)外交（Diplomacy），也被稱為外交或者外交風(fēng)云，是經(jīng)典的桌面游戲之一。該游戲與圍棋不同，它是七人游戲，需要游戲玩家既競(jìng)爭(zhēng)又合作，并且每回合玩家都會(huì)同時(shí)進(jìn)行移動(dòng)，因此，每個(gè)玩家都必須推理其他玩家的想法，非常復(fù)雜。

研制一個(gè)能玩外交游戲的人工智能軟件，DeepMind公司的計(jì)算機(jī)專家Andrea Tacchetti表示：“與游戲Go或國(guó)際象棋相比，這是一個(gè)本質(zhì)上不同的問題。” 去年12月，Tacchetti和合作者在NeurIPS會(huì)議上就其系統(tǒng)發(fā)表了一篇論文，該論文介紹了能玩外交游戲的AI系統(tǒng)策略。

“外交”是一種策略游戲，在歐洲地圖上劃分為75個(gè)省。玩家建立并動(dòng)員軍隊(duì)占領(lǐng)各省，直到控制了大部分補(bǔ)給中心的玩家獲勝。玩家每回合寫下自己的行動(dòng)，然后執(zhí)行。他們可以攻擊或防御對(duì)方玩家，或者支援對(duì)方玩家的進(jìn)攻和防御，建立聯(lián)盟。在完整版中，玩家可以協(xié)商，為了方便人工智能研究，DeepMind公司使用了簡(jiǎn)單版的“No Press”策略，不需要人工智能軟件發(fā)布策略與其他玩家進(jìn)行溝通。

從歷史上看，人工智能使用人工制定的策略來發(fā)揮決策作用。2019年，蒙特利爾研究所的Mila通過使用深度學(xué)習(xí)系統(tǒng)取得了勝利。他們基于150000個(gè)人類游戲的數(shù)據(jù)集，訓(xùn)練了一個(gè)稱為DipNet的神經(jīng)網(wǎng)絡(luò)來模仿人類。DeepMind從DipNet版本開始，使用強(qiáng)化學(xué)習(xí)（一種反復(fù)試驗(yàn)）來完善它。但是，僅通過反復(fù)試驗(yàn)來探索可能性會(huì)帶來問題。因此，他們調(diào)整了強(qiáng)化學(xué)習(xí)算法。在訓(xùn)練過程中，他們?cè)诿恳徊街卸紝?duì)對(duì)手的可能舉動(dòng)進(jìn)行采樣，計(jì)算出在這些情況下平均效果最佳的行動(dòng)，然后訓(xùn)練自己的權(quán)重以偏向于此行動(dòng)。經(jīng)過訓(xùn)練，它跳過了采樣過程，僅根據(jù)其學(xué)習(xí)的知識(shí)進(jìn)行工作。Tacchetti說：“我們論文的信息是：我們可以在這樣的環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí)?！?他們?cè)O(shè)計(jì)的一個(gè)AI玩家與六個(gè)DipNet的AI贏了30％的時(shí)間（有14％的機(jī)會(huì)）。一個(gè)DipNet對(duì)抗他們的七個(gè)，僅贏得了3％的時(shí)間。

今年4月，F(xiàn)acebook將在ICLR會(huì)議上發(fā)表一篇論文，描述他們?cè)凇癗o Press”版本的外交游戲中的研究成果。他們建立了類似DipNet的網(wǎng)絡(luò)，但是沒有添加強(qiáng)化學(xué)習(xí)的元素，而是添加了一個(gè)“SearchBot”搜索玩家策略，SearchBot通過玩幾回合來評(píng)估玩家的每種潛在策略（假設(shè)每個(gè)人都根據(jù)神經(jīng)網(wǎng)絡(luò)的首選選擇后續(xù)行動(dòng)）。策略不是一個(gè)最佳行動(dòng)組合，而是由50個(gè)可能行動(dòng)組成的一組概率（由神經(jīng)網(wǎng)絡(luò)建議）。

在真實(shí)游戲中進(jìn)行這樣的探索會(huì)減慢SearchBot的速度，但可以使它更優(yōu)于DipNet。SearchBot在外交游戲網(wǎng)站上與人類進(jìn)行了匿名比賽，在玩家中排名前2％。Facebook的計(jì)算機(jī)專家、論文的共同作者亞當(dāng)·勒勒（Adam Lerer）說：“這是第一個(gè)被證明具有能與人類競(jìng)爭(zhēng)的機(jī)器人?！?/p>

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1790

文章
46671

瀏覽量
237112
強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)

+關(guān)注

關(guān)注
4

文章
265

瀏覽量
11197
DeepMind

DeepMind

+關(guān)注

關(guān)注
0

文章
129

瀏覽量
10812

原文標(biāo)題：DeepMind又出AI大招

文章出處：【微信號(hào)：robotmagazine，微信公眾號(hào)：機(jī)器人技術(shù)與應(yīng)用】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

谷歌Vertex AI助力企業(yè)生成式AI應(yīng)用

DeepMind 在模型技術(shù)方面積極探索創(chuàng)新，尤其著力于 Gemini 和 Imagen 的改進(jìn)。我們的企業(yè) AI 平臺(tái) Vertex AI 也推出了數(shù)十項(xiàng)突破性功能。

發(fā)表于 09-09 15:59 ?431次閱讀

云開發(fā)AI助手

草帽王路飛

發(fā)布于 :2024年07月22日 14:41:54

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議

谷歌DeepMind一篇中了頂流新生代會(huì)議CoLM 2024的論文被掛了，瓜主直指其抄襲了一年前就掛在arXiv上的一項(xiàng)研究。開源的那種。

發(fā)表于 07-16 18:29 ?541次閱讀

谷歌<b class='flag-5'>DeepMind</b>被曝抄襲開源成果，論文還中了頂流會(huì)議

谷歌AI新突破：為無(wú)聲視頻智能配音

近日，谷歌DeepMind團(tuán)隊(duì)公布了一項(xiàng)革命性的技術(shù)——利用AI為無(wú)聲視頻生成背景音樂的“video-to-audio”技術(shù)。這一技術(shù)的出現(xiàn)，不僅為視頻創(chuàng)作領(lǐng)域帶來了新的可能，也為觀眾帶來了更加豐富的視聽體驗(yàn)。

發(fā)表于 06-21 10:50 ?454次閱讀

谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3，這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領(lǐng)域發(fā)揮巨大作用。

發(fā)表于 05-10 11:26 ?544次閱讀

谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發(fā)AI模型，這一創(chuàng)新技術(shù)將為科學(xué)家們提供前所未有的幫助，使他們能更精確地理解疾病機(jī)制，進(jìn)而開發(fā)出更高效的治療藥物。

發(fā)表于 05-10 09:35 ?352次閱讀

微軟斥資25億英鎊在倫敦新建AI Hub，推動(dòng)AI技術(shù)發(fā)展與商業(yè)化落地

同時(shí)，微軟還在四月初宣布成立全新的Microsoft AI團(tuán)隊(duì)，由DeepMind與Inflection聯(lián)合創(chuàng)始人Mustafa Suleyman擔(dān)任負(fù)責(zé)人，全力推動(dòng)Copilot項(xiàng)目實(shí)施。Jordan Hoffmann則將領(lǐng)銜領(lǐng)導(dǎo)位于倫敦的Microsoft

發(fā)表于 04-09 16:22 ?450次閱讀

微軟宣布組織架構(gòu)調(diào)整，組建Microsoft AI

微軟，這家全球市值最高的科技巨頭，近日宣布了一項(xiàng)重大的組織架構(gòu)調(diào)整。公司決定組建全新的Microsoft AI部門，旨在統(tǒng)一管理和推進(jìn)所有消費(fèi)者AI產(chǎn)品和研究工作。為此，微軟特地挖角了人工智能領(lǐng)域的知名人物——DeepMind的

發(fā)表于 03-21 10:52 ?783次閱讀

谷歌DeepMind推出SIMI通用AI智能體

近日，谷歌的DeepMind團(tuán)隊(duì)發(fā)布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），這是一個(gè)通用人工智能智能體，能夠在多種3D虛擬環(huán)境

發(fā)表于 03-18 11:39 ?868次閱讀

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺(tái)

據(jù)報(bào)道，谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布了AI模型Genie，此模型擁有多達(dá)110億個(gè)參數(shù)，能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場(chǎng)景。

發(fā)表于 02-27 14:53 ?709次閱讀

谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

近日，剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦，此前曾擔(dān)任谷歌

發(fā)表于 02-04 10:02 ?717次閱讀

谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

據(jù)知情人士透露，谷歌人工智能部門DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。

發(fā)表于 01-22 14:41 ?441次閱讀

再登Nature！DeepMind大模型突破60年數(shù)學(xué)難題，解法超出人類已有認(rèn)知

用大模型解決困擾數(shù)學(xué)家60多年的問題，谷歌DeepMind最新成果再登 Nature。作者之一、谷歌DeepMind研究副總裁Pushmeet Kohli表示：訓(xùn)練數(shù)據(jù)中不會(huì)有這個(gè)方案，它之前

發(fā)表于 12-24 21:40 ?500次閱讀

NVIDIA 專家關(guān)于 2024 年 AI 技術(shù)應(yīng)用趨勢(shì)的預(yù)測(cè)

: Enterprises）年度詞匯候選者頗多。隨著整個(gè)行業(yè)都聚焦于變革性的新技術(shù)，繼 “生成式 AI” 和 “生成式預(yù)訓(xùn)練Transformer” 之后，又出現(xiàn)了 “大語(yǔ)言模型（LLM）”、“檢索增強(qiáng)

發(fā)表于 12-11 18:06 ?350次閱讀

AWS和英偉達(dá)攜手推進(jìn)AI，谷歌DeepMind重塑材料科學(xué)

DeepMind在材料科學(xué)領(lǐng)域的最新發(fā)現(xiàn)，即220萬(wàn)種晶體結(jié)構(gòu)的識(shí)別，將如何徹底改變我們對(duì)新材料發(fā)現(xiàn)和應(yīng)用的理解。這些突破性成就不僅代表了科技的巨大進(jìn)步，也為未來的產(chǎn)業(yè)發(fā)展鋪平了道路。 AWS與英偉達(dá)加強(qiáng)合作，推動(dòng)AI技術(shù)發(fā)展近日，亞馬遜AWS的CEO Adam Sel

發(fā)表于 11-30 21:50 ?522次閱讀