OpenAI分析機(jī)器學(xué)習(xí)的進(jìn)化策略
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評論(0)
OpenAI總監(jiān)Ilya Sutskever昨天在EmTech Digital大會(huì)上介紹了人工智能領(lǐng)域下一個(gè)可能的爆發(fā)點(diǎn)。OpenAI是一家獨(dú)立研究機(jī)構(gòu),EmTech Digital是MIT的科學(xué)雜志《科技回顧》所組織的大會(huì)。
Sutskever介紹了一種新的機(jī)器學(xué)習(xí)研究方法,它的效果比現(xiàn)在已經(jīng)產(chǎn)生巨大突破的方法還要好。他的技術(shù)的擴(kuò)展性可能也會(huì)更好。
在這篇 https://blog.openai.com/evolution-strategies/ 博客文章里,Sutskever和同事們采用“進(jìn)化策略”讓機(jī)器理解一項(xiàng)復(fù)雜的任務(wù)。研究人員說,此方法與幾十年前的方法頗有淵源,它涉及使用模擬進(jìn)化過程的優(yōu)化算法。這些技術(shù)的本質(zhì)就是讓機(jī)器根據(jù)實(shí)驗(yàn)和優(yōu)化,找到解決復(fù)雜問題的最佳方法,它可以被應(yīng)用在機(jī)器人、自動(dòng)駕駛和其它領(lǐng)域。
OpenAI的研究人員將他們的進(jìn)化策略與強(qiáng)化學(xué)習(xí)方法做比較,后者在近些年取得了令人矚目的成果,包括計(jì)算機(jī)戰(zhàn)勝圍棋世界名將(參見《10項(xiàng)重大技術(shù):強(qiáng)化學(xué)習(xí)》https://www.technologyreview.com/s/603501/10-breakthrough-technologies-2017-reinforcement-learning/)。強(qiáng)化學(xué)習(xí)的原理來自于動(dòng)物從實(shí)踐經(jīng)驗(yàn)中學(xué)習(xí)的過程,讓機(jī)器能夠解決我們?nèi)祟惡茈y或者不可能用代碼描述的事件。
不同于強(qiáng)化學(xué)習(xí),進(jìn)化策略可以讓機(jī)器使用更少的計(jì)算資源來學(xué)習(xí)。強(qiáng)化學(xué)習(xí)通常會(huì)用到反向傳播的方法來減小神經(jīng)網(wǎng)絡(luò)的誤差。進(jìn)化策略則采用更簡單的優(yōu)化技術(shù)。
“這個(gè)方法非常有意思,可能會(huì)開啟一個(gè)全新篇章”Pedro Domingos說,他是華盛頓大學(xué)的教授和《The master algorithm》一書的作者。
Domingos質(zhì)疑這項(xiàng)技術(shù)是否能超越強(qiáng)化學(xué)習(xí),但他又補(bǔ)充到,“機(jī)器學(xué)習(xí)領(lǐng)域存在著大量簡單方法戰(zhàn)勝復(fù)雜算法的先例。我們需要耐心等待百花齊放的場景”。
人工智能領(lǐng)域需要有影響力的技術(shù)突破來維持近些年的快速發(fā)展勢頭。
人工智能近些年已經(jīng)顛覆了整個(gè)科技界,目前正在醫(yī)療健康、教育、交通和制造業(yè)等行業(yè)尋找實(shí)踐項(xiàng)目。舉個(gè)例子,深度學(xué)習(xí)利用大規(guī)模神經(jīng)網(wǎng)絡(luò)模型挖掘大數(shù)據(jù)中的模式,推進(jìn)了語音識(shí)別和圖像識(shí)別技術(shù)在醫(yī)學(xué)研究和醫(yī)療健康領(lǐng)域的應(yīng)用。
然而,與此同時(shí)我們也發(fā)現(xiàn)這些技術(shù)并不能解決所有的人工智能應(yīng)用項(xiàng)目。探索新機(jī)遇和持續(xù)性創(chuàng)新是EmTech Digital大會(huì)的突出主題。
即使新技術(shù)層出不窮,比如強(qiáng)化學(xué)習(xí)和OpenAI的進(jìn)化策略方法,終極目標(biāo),即某種意義上的通用人工智能,仍然是一個(gè)遙遠(yuǎn)的愿景。
但是,隨著強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù)不斷地向新興行業(yè)和日常生活領(lǐng)域擴(kuò)散,它也可能會(huì)給我們帶來意想不到的效果。
出席EmTech Digital的演講者們也討論了被嵌入在機(jī)器學(xué)習(xí)算法中的偏見指導(dǎo),它將影響機(jī)器做出的重大決策,比如該罪犯的合適量刑年限,客戶是否符合貸款條件等等。
隨著機(jī)器學(xué)習(xí)應(yīng)用在生活的各個(gè)領(lǐng)域,這一問題將變得更加重要,并將引發(fā)嚴(yán)重的倫理討論。這又是EmTech Digital大會(huì)的另一個(gè)主題。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
OpenAI分析機(jī)器學(xué)習(xí)的進(jìn)化策略下載
相關(guān)電子資料下載
- 如何創(chuàng)建FPGA控制的機(jī)器人手臂 49
- 機(jī)器學(xué)習(xí)需要掌握的九種工具盤點(diǎn) 16
- Hugging Face被限制訪問 404
- 《人工智能在指揮和控制系統(tǒng)中的決策支持》 133
- 生成式人工智能和機(jī)器學(xué)習(xí)正在這9個(gè)學(xué)科中打造未來 216
- 智慧礦山AI算法帶你解決皮帶運(yùn)行難題! 51
- 人工智能領(lǐng)域存在第一性原理嗎? 53
- 英特爾啟動(dòng)首個(gè)AI PC加速計(jì)劃,目標(biāo)2025年前為超100萬臺(tái)PC提供AI特性 223
- PLC就是邏輯控制嗎?PLC的網(wǎng)絡(luò)通信怎么樣? 51
- 機(jī)器學(xué)習(xí)常用的5種采樣方法盤點(diǎn) 45