Facebook AI研究人員將CraftAssist開源,這是一個(gè)為Minecraft視頻游戲構(gòu)建交互式助手機(jī)器人的框架。這些機(jī)器人使用自然語(yǔ)言理解(NLU)來解析和執(zhí)行人類玩家的文本命令,例如在游戲世界中建造房屋的請(qǐng)求。研究人員可以擴(kuò)展該框架的模塊化結(jié)構(gòu),以執(zhí)行自己的ML實(shí)驗(yàn)。
研究團(tuán)隊(duì)在最近的博客文章中對(duì)該系統(tǒng)進(jìn)行了概述。CraftAssist機(jī)器人使用與標(biāo)準(zhǔn)游戲客戶端相同的協(xié)議連接到游戲,因此可以執(zhí)行人類玩家可以執(zhí)行的任何操作。機(jī)器人使用Minecraft的內(nèi)置基于文本的聊天界面與其他玩家進(jìn)行交互。人類可以向機(jī)器人發(fā)出命令,包括高級(jí)指令,例如“在藍(lán)色立方體旁邊蓋房子”。該發(fā)行版的目的是幫助改善人與人工智能的協(xié)作:
該平臺(tái)旨在支持對(duì)與人類參與者指定和評(píng)估的各種任務(wù)交互有趣并有用的代理的研究。為了鼓勵(lì)更廣泛的AI研究社區(qū)將Craftcraft平臺(tái)用于他們自己的實(shí)驗(yàn),我們正在開放框架,基線助手以及用于構(gòu)建它的工具和數(shù)據(jù)的外包。
從廣義上講,機(jī)器人控制系統(tǒng)由感知和動(dòng)作選擇子系統(tǒng)組成。感知是將原始傳感器數(shù)據(jù)轉(zhuǎn)換為更抽象的表示;例如,圖像識(shí)別是一種感知任務(wù),它將圖像像素轉(zhuǎn)換為描述圖像內(nèi)容的文本標(biāo)簽。當(dāng)對(duì)包含許多傳感器輸入示例和所需輸出的示例的數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),現(xiàn)代的深度學(xué)習(xí)模型可以在許多視覺和NLU任務(wù)上實(shí)現(xiàn)接近人類水平的性能。
動(dòng)作選擇是機(jī)器人“決定”如何與世界互動(dòng)以實(shí)現(xiàn)某個(gè)目標(biāo)的過程。例如,為了贏得圍棋而做出的舉動(dòng)。許多成功的系統(tǒng)都使用強(qiáng)化學(xué)習(xí)(RL),在這種學(xué)習(xí)中,機(jī)器人會(huì)反復(fù)嘗試執(zhí)行任務(wù),每次嘗試都會(huì)給出數(shù)值獎(jiǎng)勵(lì) 結(jié)果。游戲是RL的常見測(cè)試平臺(tái),因?yàn)樗鼈兙哂忻鞔_的動(dòng)作和結(jié)果集,而經(jīng)過RL訓(xùn)練的現(xiàn)代機(jī)器人在許多不同的游戲中通常都可以勝過人類的頂級(jí)能力。某些研究小組(例如Google的DeepMind)將感知和動(dòng)作選擇子系統(tǒng)組合到一個(gè)由受訓(xùn)者訓(xùn)練的單一“端到端”系統(tǒng)中深度強(qiáng)化學(xué)習(xí),還有許多用于訓(xùn)練這些系統(tǒng)的虛擬環(huán)境,包括 Facebook開發(fā)的模擬棲息地。微軟已經(jīng)為Minecraft開源了一個(gè)名為Project Malmo的“ AI-gym”界面以及一個(gè)大型數(shù)據(jù)集,以鼓勵(lì)將Minecraft用作RL研究的測(cè)試平臺(tái)。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
27847瀏覽量
204655 -
Facebook
+關(guān)注
關(guān)注
3文章
1429瀏覽量
54479 -
開源
+關(guān)注
關(guān)注
3文章
3133瀏覽量
42079
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論