機(jī)器學(xué)習(xí)(ML)是教導(dǎo)計(jì)算機(jī)系統(tǒng)根據(jù)一組數(shù)據(jù)進(jìn)行預(yù)測(cè)的過(guò)程。通過(guò)為系統(tǒng)提供一系列的試驗(yàn)和錯(cuò)誤場(chǎng)景,機(jī)器學(xué)習(xí)研究人員致力于創(chuàng)建 可以分析數(shù)據(jù),回答問(wèn)題并自行做出決定的人工智能系統(tǒng)。
機(jī)器學(xué)習(xí)通常使用基于測(cè)試數(shù)據(jù)的算法,該算法有助于在將來(lái)的決策中進(jìn)行推理和模式識(shí)別,從而消除了對(duì)傳統(tǒng)計(jì)算機(jī)軟件要求的來(lái)自人類的明確指令的需求。
什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)依賴于大量數(shù)據(jù),這些數(shù)據(jù)被饋送到算法中,以生成一個(gè)模型,系統(tǒng)可以根據(jù)該模型來(lái)預(yù)測(cè)其未來(lái)的決策。例如,如果您要輸入到系統(tǒng)中的數(shù)據(jù)是一年中每天在午餐中吃的水果,則您可以使用預(yù)測(cè)算法來(lái)分析不同的水果,并為該水果建立預(yù)測(cè)模型您可能在第二年進(jìn)食。
該過(guò)程基于反復(fù)試驗(yàn)的情況,通常使用多種算法。這些算法分為線性模型,非線性模型,甚至神經(jīng)網(wǎng)絡(luò)。它們最終將取決于您正在使用的數(shù)據(jù)集以及您要回答的問(wèn)題。
機(jī)器學(xué)習(xí)算法如何工作?
機(jī)器學(xué)習(xí)算法會(huì)隨著時(shí)間的推移使用數(shù)據(jù)來(lái)學(xué)習(xí)和改進(jìn),并且不需要人工指導(dǎo)。該算法分為三種類型:有監(jiān)督,無(wú)監(jiān)督和強(qiáng)化學(xué)習(xí)。每種學(xué)習(xí)類型都有不同的目的,并且可以使數(shù)據(jù)以不同的方式使用。
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)涉及標(biāo)記的訓(xùn)練數(shù)據(jù),算法使用該訓(xùn)練數(shù)據(jù)來(lái)學(xué)習(xí)將輸入變量轉(zhuǎn)換為輸出變量以求解方程的映射函數(shù)。其中有兩種監(jiān)督學(xué)習(xí)類型:分類,當(dāng)輸出為類別形式時(shí),用于預(yù)測(cè)給定樣本的結(jié)果;回歸,當(dāng)輸出時(shí),用于預(yù)測(cè)給定樣本的結(jié)果。變量是實(shí)際值,例如“工資”或“權(quán)重”。
監(jiān)督學(xué)習(xí)模型的一個(gè)示例是K-最近鄰居(KNN)算法,它是一種模式識(shí)別方法。KNN本質(zhì)上涉及使用圖表來(lái)根據(jù)附近相似物體的傳播情況得出關(guān)于物體分類的有根據(jù)的猜測(cè)。
在上表中,綠色圓圈表示一個(gè)尚未分類的對(duì)象,它只能屬于兩個(gè)可能的類別之一:藍(lán)色正方形或紅色三角形。為了識(shí)別其所屬的類別,在這種情況下,算法將分析圖表上最接近的對(duì)象,算法將合理地假設(shè)綠色圓圈應(yīng)屬于紅色三角形類別。
無(wú)監(jiān)督學(xué)習(xí)
當(dāng)只有輸入變量而沒(méi)有相應(yīng)的輸出變量時(shí),將使用無(wú)監(jiān)督學(xué)習(xí)模型。它使用未標(biāo)記的訓(xùn)練數(shù)據(jù)來(lái)建模數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu)。
無(wú)監(jiān)督學(xué)習(xí)算法有三種類型:關(guān)聯(lián),廣泛用于市場(chǎng)購(gòu)物分析;聚類,用于匹配與另一個(gè)聚類中的對(duì)象相似的樣本;和降維,用于減少數(shù)據(jù)集中變量的數(shù)量,同時(shí)保持其重要信息不變。
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)允許代理通過(guò)學(xué)習(xí)最大化獎(jiǎng)勵(lì)的行為,根據(jù)其當(dāng)前狀態(tài)決定其下一步行動(dòng)。它通常用于游戲環(huán)境,在游戲環(huán)境中提供了規(guī)則的算法,并負(fù)責(zé)以最有效的方式解決挑戰(zhàn)。該模型最初會(huì)隨機(jī)開(kāi)始,但是隨著時(shí)間的流逝,通過(guò)反復(fù)試驗(yàn),它將了解需要在游戲中移動(dòng)的位置和時(shí)間以最大化得分。
在這種類型的培訓(xùn)中,獎(jiǎng)勵(lì)僅僅是與積極成果相關(guān)的狀態(tài)。例如,如果算法能夠?qū)⑵嚤3衷诘缆飞隙粫?huì)撞到障礙物,那么它將“獎(jiǎng)勵(lì)”任務(wù)完成。
為什么機(jī)器學(xué)習(xí)很有用?
本質(zhì)上,機(jī)器學(xué)習(xí)解決了數(shù)據(jù)過(guò)多的問(wèn)題。人們,行動(dòng),事件,計(jì)算機(jī)和小工具所產(chǎn)生的信息太多,以至于人類幾乎不可能從中學(xué)習(xí)任何東西。在醫(yī)學(xué)分析中,要在成千上萬(wàn)的MRI掃描中找到模式,一個(gè)人可能要花費(fèi)數(shù)小時(shí),數(shù)天或數(shù)周的時(shí)間才能完成,但是如果正確標(biāo)記了機(jī)器,機(jī)器可以吸收這些信息并在幾秒鐘內(nèi)發(fā)現(xiàn)這些模式。
機(jī)器學(xué)習(xí)在哪里使用?
我們每天都會(huì)使用最簡(jiǎn)單,最成功的機(jī)器學(xué)習(xí)示例之一-Google搜索。搜索引擎由許多ML算法提供支持,這些算法可以讀取和分析您輸入的文本,并根據(jù)您的搜索歷史和在線習(xí)慣來(lái)定制結(jié)果。例如,如果您輸入“ Java”,您將獲得圍繞編程語(yǔ)言的結(jié)果,或者更頻繁地浮出水面,這取決于它決定了您的偏好。
我們未來(lái)的許多技術(shù)進(jìn)步都取決于機(jī)器學(xué)習(xí)的發(fā)展,例如無(wú)人駕駛汽車和智慧城市。許多為智慧城市提供動(dòng)力的系統(tǒng)正在進(jìn)入公共空間,例如面部識(shí)別系統(tǒng),該系統(tǒng)中的機(jī)器學(xué)習(xí)算法被教為識(shí)別圖像中的模式并根據(jù)其特征識(shí)別對(duì)象。但是,這已被證明是ML的有爭(zhēng)議用途,尤其是因?yàn)樗⒉豢偸菧?zhǔn)確的,并且經(jīng)常涉及對(duì)公民的某種定期監(jiān)視。
數(shù)據(jù)偏差
隨著機(jī)器學(xué)習(xí)的改進(jìn)和更多技術(shù)的使用,人們?cè)絹?lái)越擔(dān)心將偏見(jiàn)嵌入關(guān)鍵的和面向公眾的軟件中。機(jī)器學(xué)習(xí)應(yīng)用程序依賴于數(shù)據(jù),而正是這些數(shù)據(jù)可能成為偏差的來(lái)源。例如,如果一家公司想雇用更多不同種類的人,但使用其當(dāng)前雇員的簡(jiǎn)歷,則默認(rèn)情況下,其機(jī)器學(xué)習(xí)程序?qū)⒅粚ふ腋嘞嗤娜恕?/p>
正是這種類型的機(jī)器學(xué)習(xí)應(yīng)用引起了政府的擔(dān)憂,因此,許多政府正在采取強(qiáng)制性的法規(guī)來(lái)解決這個(gè)問(wèn)題。英國(guó)數(shù)據(jù)倫理與創(chuàng)新中心(CDEI)宣布將與內(nèi)閣辦公室種族差異部門合作,調(diào)查算法決策中的潛在偏見(jiàn)。同樣,美國(guó)政府將試行AI方面的多樣性法規(guī),以降低計(jì)算機(jī)系統(tǒng)中性偏見(jiàn)和種族偏見(jiàn)的風(fēng)險(xiǎn)。
責(zé)編AJX
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6837瀏覽量
88754 -
人工智能
+關(guān)注
關(guān)注
1791文章
46689瀏覽量
237177 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8356瀏覽量
132324
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論