久久免费人成网站福利院,国产高清色高清在线观看九

人們通常會(huì)派出最強(qiáng)大的選手和場景訓(xùn)練人工智能，但是，智能體如何應(yīng)對(duì)訓(xùn)練中故意碰瓷兒的“弱”對(duì)手呢？

來看看下邊的兩個(gè)場景：兩個(gè)AI智能體正在“訓(xùn)練場“進(jìn)行一場激烈的足球賽，一個(gè)守門、一個(gè)射門。當(dāng)守門員忽然自己摔倒，攻方?jīng)]有選擇乘勝追擊，也忽然不知所措了起來。

在相撲的規(guī)則下也一樣，當(dāng)其中一個(gè)隊(duì)員開始不按套路出牌時(shí)，另一個(gè)對(duì)手也亂作一團(tuán)，雙方立刻開始毫無規(guī)則扭打在一起。

這樣“人工智障”的場景可不是隨意配置的游戲，而是一項(xiàng)對(duì)AI對(duì)抗訓(xùn)練的研究。

我們知道，通常情況下，智能體都是通過相互對(duì)抗來訓(xùn)練的，無論是下圍棋的阿法狗還是玩星際爭霸的AlphaStar，都是通過海量的對(duì)局來訓(xùn)練自己的模型，從而探索出獲勝之道。

但是試想一下，如果給阿法狗的訓(xùn)練數(shù)據(jù)都是圍棋小白亂下的對(duì)局，給AlphaStar提供的是小學(xué)生局，結(jié)果會(huì)是如何？

近期，來自伯克利的研究人員就進(jìn)行了這樣的實(shí)驗(yàn)。紅色機(jī)器人與已經(jīng)是專家級(jí)別的藍(lán)色機(jī)器人進(jìn)行對(duì)抗訓(xùn)練，紅色機(jī)器人采取一定的對(duì)抗策略攻擊藍(lán)色機(jī)器人進(jìn)行的深度學(xué)習(xí)。這項(xiàng)研究的論文作者也在NIPS大會(huì)上對(duì)該研究進(jìn)行了展示。

論文鏈接：

https://arxiv.org/pdf/1905.10615.pdf

在實(shí)驗(yàn)中，紅色機(jī)器人為了不讓藍(lán)色機(jī)器人繼續(xù)從對(duì)抗中學(xué)習(xí)，沒有按照應(yīng)有的方式玩游戲，而是開始“亂舞”起來，結(jié)果，藍(lán)色機(jī)器人開始玩得很糟糕，像喝醉了的海盜一樣來回?fù)u晃，輸?shù)舻挠螒驍?shù)量是正常情況下的兩倍。

研究發(fā)現(xiàn)，在采取對(duì)抗性政策的對(duì)局中，獲勝不是努力成為一般意義上的強(qiáng)者，而是采取迷惑對(duì)手的行動(dòng)。研究人員通過對(duì)對(duì)手行為的定性觀察來驗(yàn)證這一點(diǎn)，并發(fā)現(xiàn)當(dāng)被欺騙的AI在對(duì)對(duì)手視而不見時(shí)，其表現(xiàn)會(huì)有所改善。

我們都知道，讓人工智能變得更聰明的一個(gè)方法是讓它從環(huán)境中學(xué)習(xí)，例如，未來的自動(dòng)駕駛可能比人類更善于識(shí)別街道標(biāo)志和避開行人，因?yàn)樗鼈兛梢酝ㄟ^海量的視頻獲得更多的經(jīng)驗(yàn)。

但是如果有人利用這一方式進(jìn)行研究中所示的“對(duì)抗性攻擊” ——通過巧妙而精確地修改圖像，那么你就可以愚弄人工智能，讓它對(duì)圖像產(chǎn)生錯(cuò)誤的理解。例如，在一個(gè)停車標(biāo)志上貼上幾個(gè)貼紙可能被視為限速標(biāo)志，同時(shí)這項(xiàng)新的研究也表明，人工智能不僅會(huì)被愚弄，看到不該看到的東西，還會(huì)以不該看到的方式行事。

這給基于深度學(xué)習(xí)的人工智能應(yīng)用敲響了一個(gè)警鐘，這種對(duì)抗性的攻擊可能會(huì)給自動(dòng)駕駛、金融交易或產(chǎn)品推薦系統(tǒng)帶來現(xiàn)實(shí)問題。

論文指出，在這些安全關(guān)鍵型的系統(tǒng)中，像這樣的攻擊最受關(guān)注，標(biāo)準(zhǔn)做法是驗(yàn)證模型，然后凍結(jié)它，以確保部署的模型不會(huì)因再訓(xùn)練而產(chǎn)生任何新問題。

因此，這項(xiàng)研究中的攻擊行為也真實(shí)地反映了在現(xiàn)實(shí)環(huán)境中，例如在自動(dòng)駕駛車輛中看到的深度學(xué)習(xí)訓(xùn)練策略，此外，即使被攻擊目標(biāo)使用持續(xù)學(xué)習(xí)，也會(huì)有針對(duì)固定攻擊目標(biāo)進(jìn)行訓(xùn)練的策略，攻擊者可以對(duì)目標(biāo)使用模擬學(xué)習(xí)來生成攻擊模型。

或者，在自動(dòng)駕駛車輛，攻擊者可以通過購買系統(tǒng)的副本并定期在工廠重置它，一旦針對(duì)目標(biāo)訓(xùn)練出了敵對(duì)策略，攻擊者就可以將此策略傳輸?shù)侥繕?biāo)，并利用它直到攻擊成功為止。

研究也對(duì)今后的工作提出了一些方向：深度學(xué)習(xí)策略容易受到攻擊，這突出了有效防御的必要性，因此在系統(tǒng)激活時(shí)可以使用密度模型檢測到可能的對(duì)抗性攻擊，在這種情況下，還可以及時(shí)退回到保守策略。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
210

文章
28108

瀏覽量
205860
智能體

智能體

+關(guān)注

關(guān)注
1

文章
125

瀏覽量
10554
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5466

瀏覽量
120891

評(píng)論

相關(guān)推薦

瓷介電容器在性能上有哪些主要優(yōu)缺點(diǎn)

瓷介電容器是一種使用陶瓷材料作為介質(zhì)的電容器，廣泛應(yīng)用于電子電路中，用于儲(chǔ)存和釋放電能、濾波、去耦、諧振等。由于陶瓷材料的介電常數(shù)較高，瓷介電容器通常具有較小的體積和較高的電容值。然而，它們也有一些

發(fā)表于 09-20 15:25 ?339次閱讀

電磁干擾訓(xùn)練系統(tǒng)原理是什么

智慧華盛恒輝電磁干擾訓(xùn)練系統(tǒng)的原理主要基于電磁干擾(EMI)的基本原理，即利用電磁波對(duì)電子設(shè)備或系統(tǒng)產(chǎn)生的干擾，通過模擬真實(shí)的電磁環(huán)境，對(duì)受訓(xùn)人員進(jìn)行電磁干擾應(yīng)對(duì)能力的訓(xùn)練。以下是電磁干擾訓(xùn)練

發(fā)表于 07-22 16:34 ?296次閱讀

工業(yè)一體機(jī)在智能分揀中的應(yīng)用

工業(yè)一體機(jī)在智能分揀系統(tǒng)中的應(yīng)用是物流行業(yè)自動(dòng)化和智能化升級(jí)的重要組成部分。這些設(shè)備通常具備高性能計(jì)算能力、穩(wěn)定性和耐用性，能夠在復(fù)雜和苛刻的工業(yè)環(huán)境

發(fā)表于 07-15 15:25 ?276次閱讀

其利天下技術(shù)·無刷電機(jī)弱磁控制是什么？有什么好處·BLDC驅(qū)動(dòng)方案

作為一個(gè)無刷電機(jī)驅(qū)動(dòng)方案開發(fā)商，我們?cè)陂_發(fā)產(chǎn)品的時(shí)候就會(huì)用到“弱磁控制技術(shù)”。比如，我們開發(fā)的吸塵器方案時(shí)就會(huì)用到。什么是弱磁控制技術(shù)，它又有什么優(yōu)勢呢？其利天下技術(shù)無刷電機(jī)驅(qū)動(dòng)方案開發(fā)弱

發(fā)表于 06-07 18:42 ?859次閱讀

什么是電機(jī)的弱磁？電機(jī)弱磁的可能原因有哪些？

在電機(jī)運(yùn)行的過程中，我們有時(shí)會(huì)遇到電機(jī)弱磁的情況。電機(jī)弱磁，簡而言之，即電機(jī)在運(yùn)行時(shí)輸出功率下降，不足以滿足正常使用需求的現(xiàn)象。這一現(xiàn)象可能由多種原因引起，對(duì)電機(jī)的性能和運(yùn)行穩(wěn)定性產(chǎn)生不良影響。本文將詳細(xì)探討電機(jī)的

發(fā)表于 06-04 16:15 ?3516次閱讀

遇到液晶拼接屏幕左右黑屏的問題應(yīng)該怎樣應(yīng)對(duì)呢？

如今放眼望與商顯市場中，液晶拼接屏現(xiàn)在已廣泛的被應(yīng)用于各個(gè)行業(yè)領(lǐng)域。在液晶拼接屏被廣泛應(yīng)用的同時(shí)，用戶對(duì)液晶拼接屏的“五臟”并不了解，不管液晶拼接屏的性能有多么的穩(wěn)定，但是日常中小故障也是難免會(huì)有的，比如，液晶拼接屏左右黑屏的現(xiàn)象就是問題常見之一。如果遇到此種問題，用戶應(yīng)該怎樣應(yīng)

發(fā)表于 06-04 14:37 ?554次閱讀

大模型不夠用，還有“AI智能體”？

模型，為什么還需要發(fā)展AI智能體呢？這還需要從AI智能體是什么講起。#01-AI智能

發(fā)表于 05-12 08:04 ?344次閱讀

瓷管電阻器的作用使用瓷管電阻器的注意事項(xiàng)

瓷管電阻器的作用使用瓷管電阻器的注意事項(xiàng)? 瓷管電阻器是一種常見的電器元件，用于限制電流、測量電流和調(diào)節(jié)電壓等功能。它由瓷管和內(nèi)部的電阻體

發(fā)表于 03-05 16:30 ?1458次閱讀

知語云智能科技無人機(jī)防御系統(tǒng)：應(yīng)對(duì)新興威脅的先鋒力量

隨著科技的飛速發(fā)展，無人機(jī)技術(shù)在各個(gè)領(lǐng)域的應(yīng)用日益廣泛，但隨之而來的是無人機(jī)威脅的不斷升級(jí)。為了有效應(yīng)對(duì)這些新興威脅，知語云智能科技推出了先進(jìn)的無人機(jī)防御系統(tǒng)，為空中安全保駕護(hù)航。無人機(jī)防御系統(tǒng)

發(fā)表于 02-26 16:35

高頻瓷介電容與滌綸電容、低頻瓷介電容的區(qū)別

等方面存在一些顯著的差異。首先，我們來看高頻瓷介電容。高頻瓷介電容以陶瓷材料為基礎(chǔ)，廣泛應(yīng)用于高頻電路中，如無線通信系統(tǒng)、射頻放大器等。它具有以下幾個(gè)特點(diǎn)： 1. 高頻特性：高頻瓷介

發(fā)表于 02-02 15:54 ?1493次閱讀

如何判斷超高壓瓷介電容的好壞

如何判斷超高壓瓷介電容的好壞? 超高壓瓷介電容器是一種常見的電力設(shè)備，用于電力系統(tǒng)中的電能傳輸和維護(hù)電網(wǎng)穩(wěn)定性。因此，判斷超高壓瓷介電容器的好壞對(duì)確保電力系統(tǒng)的安全和穩(wěn)定至關(guān)重要。本文

發(fā)表于 02-02 15:43 ?841次閱讀

高壓瓷介電容和安規(guī)電容有什么區(qū)別呢？

高壓瓷介電容和安規(guī)電容有什么區(qū)別呢？高壓瓷介電容和安規(guī)電容是兩種不同類型的電容，它們?cè)诮Y(jié)構(gòu)、特性、應(yīng)用范圍等方面存在一定的區(qū)別。以下是對(duì)這兩種電容的詳細(xì)介紹：一、高壓瓷介電容： 1

發(fā)表于 12-21 10:42 ?782次閱讀

高壓瓷介電容和低壓瓷介電容特點(diǎn)有什么不一樣？

高壓瓷介電容和低壓瓷介電容特點(diǎn)有什么不一樣？高壓瓷介電容器和低壓瓷介電容器是兩種常見的介電容器類型，它們?cè)陔娙葜?、工作電壓、結(jié)構(gòu)設(shè)計(jì)等方面存在顯著的差異。以下將詳細(xì)介紹高壓

發(fā)表于 12-21 10:41 ?897次閱讀

LTCC生瓷層壓中腔體的形變?cè)u(píng)價(jià)及控制方法

摘要：以含有腔體結(jié)構(gòu)的LTCC疊層生瓷為研究對(duì)象，介紹了腔體在層壓形變的評(píng)價(jià)和控制方法。分析了LTCC空腔在層壓時(shí)產(chǎn)生變形的主要影響因素。闡述了在生瓷表面上增加金屬掩模板來控制腔體形變的疊層

發(fā)表于 12-18 16:00 ?1129次閱讀

激光焊接機(jī)出光弱該怎么解決？

任務(wù)。那么,造成激光焊出光弱的原因是什么呢? ? ? ? 光源功率不足是導(dǎo)致激光焊出光弱的主要原因之一。激光焊接過程中需要大量的能量來加熱和熔化焊件,如果光源功率不足,就無法提供足夠的

發(fā)表于 12-14 08:44 ?1275次閱讀