德?lián)浔徽J(rèn)為是難度遠(yuǎn)超其他游戲的人工智能挑戰(zhàn)項(xiàng)目。然而CMU和Facebook聯(lián)合打造的AI賭神Pluribus,訓(xùn)練成本150美元、8天訓(xùn)練時(shí)間即吊打職業(yè)選手,每小時(shí)贏1000美元!如此強(qiáng)悍的AI是如何煉成的?要研究其算法該如何入手?
人們發(fā)現(xiàn)規(guī)則明確的游戲,即使像星際這樣戰(zhàn)局多變的即時(shí)戰(zhàn)略游戲,人類也無法戰(zhàn)勝擁有碾壓性算力優(yōu)勢(shì)的計(jì)算機(jī)。于是有人寄希望于帶有運(yùn)氣成分、需要大量心里戰(zhàn)的***。
*** (Texas hold'em,有時(shí)也簡(jiǎn)稱為Hold'em或Holdem),簡(jiǎn)稱德?lián)?,是世界上最流行的公牌撲克衍生游戲,也是?guó)際撲克比賽的正式競(jìng)賽項(xiàng)目之一。***是位置順序影響最大的撲克衍生游戲之一,因?yàn)樗休啍?shù)的下注次序維持不變。它也是美國(guó)多數(shù)***內(nèi)最受歡迎的撲克牌類游戲,在美國(guó)以外的地區(qū)也十分流行,理論上一桌同時(shí)最多可容納22位(若不銷牌則為23位)牌手,但一般是二至十人一桌。ht***.wikipedia.org/wiki/%E5%BE%B7%E5%B7%9E%E6%92%B2%E5%85%8B
賭神下凡:1小時(shí)贏7000塊,一周煉成百萬富翁
撲克是典型的不完美信息博弈游戲。***中,玩家無法獲知已發(fā)生事件的全部信息,一對(duì)一無限注中包含10^160個(gè)決策點(diǎn)(decision points)。
每個(gè)點(diǎn)需要根據(jù)出牌方的理解,產(chǎn)生不同的路徑。這種不完整信息的特質(zhì),使得***成為難度遠(yuǎn)超其他游戲的人工智能挑戰(zhàn)項(xiàng)目。
然而,其實(shí)結(jié)局早就在暗中被注定了。40年來,科學(xué)家就一直沒有停止過對(duì)德州的研究。
10年前,計(jì)算機(jī)第一次在有限制的***游戲中,戰(zhàn)勝了人類頂級(jí)選手;4年前,來自加拿大阿爾伯塔大學(xué)的研究團(tuán)隊(duì)開發(fā)出Cepheus(仙王座),一個(gè)號(hào)稱人類無法戰(zhàn)勝的撲克機(jī)器人;2年前,也就是2017年,加拿大和捷克的科學(xué)家在arXiv上發(fā)表論文,提出名為DeepStack的算法,稱可以讓人工智能在比賽中擁有“直覺”。
而前兩天,在CMU科學(xué)家的努力下,人工智能已經(jīng)在六人無限注德?lián)浔荣惿蠐魯∷腥祟愴敿馔婕摇V淮嬖谟陔娪半娨晞≈械馁€神,現(xiàn)在真實(shí)的存在于現(xiàn)實(shí)世界了!
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7174瀏覽量
87160 -
人工智能
+關(guān)注
關(guān)注
1787文章
46061瀏覽量
235055
原文標(biāo)題:1小時(shí)贏1000美元的AI賭神是怎樣煉成的?幕后團(tuán)隊(duì)在線答疑
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論