强壮公的侵犯让我高潮不断,妺妺窝人体色www在线一

失敗是成功之母：HER有自我審視能力。

OpenAI的研究人員集中精力于構(gòu)建具有更強的學習能力的人工智能。得益于他們的增強學習系統(tǒng)OpenAI baselines，機器學習算法可以進行自主學習。目前，這個新的算法保證人工智能可以像人類一樣從自己的錯誤中汲取教訓。

這個進步源于OpenAI的研究人員在近期公布的名為“后見之明經(jīng)驗復現(xiàn)（Hindsight Experience Reply, HER）”的開源算法。正如名字所示，HER幫助人工智能系統(tǒng)在完成一項任務后，具有自我審視的能力。OpenAI的博客中提到，人工智能認為失敗乃成功之母。

研究人員寫到：“構(gòu)建HER的關(guān)鍵在于利用人類的直覺：在實現(xiàn)某個任務時，雖然我們沒有成功，但是在這個過程中我們學到一些不一樣的東西，既然如此，為何不能將我們最終學到的知識作為我們最初的目標呢？“

簡而言之，這意味著每一次失敗的嘗試都是為了實現(xiàn)一個意想不到的“虛擬”目標，而非既定目標。

回想一下你學騎單車的經(jīng)歷，在最開始的幾次嘗試中，你無法掌握平衡。但是這些經(jīng)驗告訴了你怎么騎車是不正確的，怎么做不能保持平衡。就像在人類的學習過程中，每一次的失敗讓我們距離成功更進一步。

獎勵每一次失敗，并且失敗也不沮喪

通過使用HER，OpenAI希望他們的人工智能系統(tǒng)可以利用上述的方法來學習。與此同時，這種算法也被作為增強學習模型中的獎勵機制的替代算法。為了訓練人工智能，使其具有獨立的學習能力，它需要包含一個獎勵機制：如果人工智能算法達到了預期目標，就可以得到一個小獎勵，就像獎勵給小孩子一塊奶油餅干一樣，否則就什么都得不到。另外一個系統(tǒng)根據(jù)人工智能距離預期目標的距離來給出獎勵。

但是這兩種算法并不是完美的。第一個算法會阻礙學習，因為一個人工智能算法在訓練過程中要么得到獎勵，要么沒得到。另一方面，根據(jù)IEEE Spectrum報道的內(nèi)容顯示，第二系統(tǒng)在實現(xiàn)時，需要衡量與目標的距離并給出獎勵，這個過程是很需要技巧的。如果把每一個任務都當作是后見之明的目標，即使人工智能系統(tǒng)沒有完成指定的任務，HER也會提供一個獎勵。這樣幫助人工智能更快更好地學習。

OpenAI 在他的的博客中提到：“通過進行這種獎勵機制的替換，強化學習算法在實現(xiàn)某些目標后會獲得一個學習信號，即使這個學習任務不是它最初希望實現(xiàn)的。如果重復這個過程，系統(tǒng)最終可以實現(xiàn)任意的目標，包括最初的既定目標。

這種方法并不意味著使用HER方法可以完全簡化人工智能系統(tǒng)學習某個任務的過程。研究者表示：“在機器人上使用HER進行學習仍然很難實現(xiàn)，因為這個過程需要大量的數(shù)據(jù)“。

無論如何，正如OpenAI的模型所顯示的，HER有助于鼓勵人工智能系統(tǒng)像人類一樣從錯誤中學習，兩者的主要區(qū)別在于人工智能在面對失敗的時候不會像一些脆弱的人類那樣傷心沮喪。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46666

瀏覽量
237102
機器學習

機器學習

+關(guān)注

關(guān)注
66

文章
8353

瀏覽量
132315

原文標題：高明！OpenAI提出HER算法，AI系統(tǒng)學會從錯誤中學習

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Vicor技術(shù)如何改進生成式人工智能的供電

生成式人工智能（genAI）帶來的文化革命可能像互聯(lián)網(wǎng)普及一樣對人類產(chǎn)生深遠影響。從您的角度來看，目前情況如何?

發(fā)表于 10-16 09:54 ?251次閱讀

Vicor技術(shù)如何改進生成式<b class='flag-5'>人工智能</b>的供電

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

和國際合作等多個層面。這些內(nèi)容讓我更加認識到，在推動人工智能與能源科學融合的過程中，需要不斷探索和創(chuàng)新，以應對各種挑戰(zhàn)和機遇。最后，通過閱讀這一章，我深刻感受到人工智能對于能源科學的

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

農(nóng)業(yè)、環(huán)保等，為人類社會的可持續(xù)發(fā)展做出貢獻。總結(jié) 《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章關(guān)于AI與生命科學的部分，為我們展示了一個充滿希望和機遇的未來。在這個未來中，

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

深刻認識到人工智能在推動科學進步中的核心價值。它不僅是科技進步的加速器，更是人類智慧拓展的催化劑，引領(lǐng)我們邁向一個更加智慧、高效、可持續(xù)的科

發(fā)表于 10-14 09:12

risc-v在人工智能圖像處理應用前景分析

RISC-V在人工智能圖像處理領(lǐng)域的應用前景十分廣闊，這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析：一、RISC-V的基本特點 RISC-V

發(fā)表于 09-28 11:00

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學創(chuàng)新

！《AI for Science：人工智能驅(qū)動科學創(chuàng)新》這本書便將為讀者徐徐展開AI for Science的美麗圖景，與大家一起去了解： 人工智能究竟幫科學家做了什么？ 人工智能

發(fā)表于 09-09 13:54

OpenAI在人工智能領(lǐng)域發(fā)展勢頭強勁

北京時間8月29日，彭博社援引知情人士消息，揭示了OpenAI即將完成其新一輪融資的重要進展。本輪融資由知名投資機構(gòu)興盛資本（Thrive Capital）領(lǐng)銜，預計估值將突破千億美元大關(guān)，標志著OpenAI在

發(fā)表于 08-29 15:37 ?408次閱讀

FPGA在人工智能中的應用有哪些？

FPGA（現(xiàn)場可編程門陣列）在人工智能領(lǐng)域的應用非常廣泛，主要體現(xiàn)在以下幾個方面：一、深度學習加速訓練和推理過程加速：FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性

發(fā)表于 07-29 17:05

人工智能如何改變著各行各樣

人工智能的風起云涌，幾乎顛覆了千行百業(yè)創(chuàng)新的節(jié)奏，今天的人工智能就如同揮舞著“指揮棒”一樣，改變著各行各樣本來的“模樣”。

發(fā)表于 07-19 10:58 ?453次閱讀

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

當?shù)貢r間5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎(chǔ)上，這種迭代擁有顯著的改進。在發(fā)布會的演示中，OpenAI展示

發(fā)表于 05-27 15:43

Meta高管稱大語言模型永遠無法像人類一樣

Meta的人工智能主管楊立昆近日表示，盡管ChatGPT等生成式人工智能產(chǎn)品備受矚目，但其背后的大型語言模型（LLM）永遠無法實現(xiàn)像人類一樣的推理和計劃能力。

發(fā)表于 05-27 09:50 ?403次閱讀

Anthropic 聲稱其新的 AI 聊天機器人模型擊敗了 OpenAI 的 GPT-4

ABSTRACT摘要新的Claude3系列人工智能模型的性能與Google和OpenAI的領(lǐng)先模型一樣好，甚至更好JAEALOT2024年3月5日Anthropic是一家由

發(fā)表于 03-06 08:24 ?483次閱讀

嵌入式人工智能的就業(yè)方向有哪些?

嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下，嵌入式人工智能成為國家新型基礎(chǔ)建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下，眾多名企也紛紛在嵌入式人工智能

發(fā)表于 02-26 10:17

OpenAI發(fā)布人工智能文生視頻大模型Sora

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI宣布推出其最新的人工智能文生視頻大模型——Sora。這款模型在繼承DALL-E 3卓越畫質(zhì)和遵循指令能力的基礎(chǔ)上，實現(xiàn)了對真實物理世界的深度模擬，為視頻制作領(lǐng)域帶來了前所未有的變革。

發(fā)表于 02-20 13:54 ?797次閱讀

OpenAI CEO稱人類水平的AI即將出現(xiàn)

OpenAI首席執(zhí)行官山姆·奧特曼（Sam Altman）近日表示，達到人類水平的人工智能（AI）即將出現(xiàn)，但他認為這種技術(shù)對世界的影響可能遠沒有人們想象的那么大。

發(fā)表于 01-17 14:59 ?784次閱讀

搜索歷史

高明！OpenAI提出HER算法，人工智能可像人類一樣認識錯誤汲取教訓

評論

Vicor技術(shù)如何改進生成式人工智能的供電

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

risc-v在人工智能圖像處理應用前景分析

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學創(chuàng)新

OpenAI在人工智能領(lǐng)域發(fā)展勢頭強勁

FPGA在人工智能中的應用有哪些？

人工智能如何改變著各行各樣

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

Meta高管稱大語言模型永遠無法像人類一樣

Anthropic 聲稱其新的 AI 聊天機器人模型擊敗了 OpenAI 的 GPT-4

嵌入式人工智能的就業(yè)方向有哪些?

OpenAI發(fā)布人工智能文生視頻大模型Sora

OpenAI CEO稱人類水平的AI即將出現(xiàn)

搜索歷史

高明！OpenAI提出HER算法，人工智能可像人類一樣認識錯誤汲取教訓

評論

高明！OpenAI提出HER算法，人工智能可像人類一樣認識錯誤汲取教訓