機(jī)器學(xué)習(xí)是一種數(shù)據(jù)分析技術(shù),讓計(jì)算機(jī)執(zhí)行人和動(dòng)物與生俱來(lái)的活動(dòng):從經(jīng)驗(yàn)中學(xué)習(xí)。
技能挑戰(zhàn)
MATLAB 微信公眾號(hào)回復(fù)【M測(cè)試】,10 道選擇題考驗(yàn)?zāi)愕臋C(jī)器學(xué)習(xí)技能!敢來(lái)試試嗎?
機(jī)器學(xué)習(xí)算法使用計(jì)算方法直接從數(shù)據(jù)中“學(xué)習(xí)”信息,而不依賴于預(yù)定方程模型。當(dāng)可用于學(xué)習(xí)的樣本數(shù)量增加時(shí),這些算法可自適應(yīng)提高性能。隨著大數(shù)據(jù)應(yīng)用增加,機(jī)器學(xué)習(xí)已成為解決以下領(lǐng)域問題的一項(xiàng)關(guān)鍵技術(shù):
計(jì)算金融學(xué),用于信用評(píng)估和算法交易
圖像處理和計(jì)算機(jī)視覺,用于人臉識(shí)別、運(yùn)動(dòng)檢測(cè)和對(duì)象檢測(cè)
計(jì)算生物學(xué),用于腫瘤檢測(cè)、藥物發(fā)現(xiàn)和 DNA 序列分析
能源生產(chǎn),用于預(yù)測(cè)價(jià)格和負(fù)載
汽車、航空航天和制造業(yè),用于預(yù)見性維護(hù)
自然語(yǔ)言處理,用于語(yǔ)音識(shí)別應(yīng)用
視頻:什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)算法能夠在產(chǎn)生洞察力的數(shù)據(jù)中發(fā)現(xiàn)自然模式,幫助您更好地制定決策和做出預(yù)測(cè)。醫(yī)療診斷、股票交易、能量負(fù)荷預(yù)測(cè)及更多行業(yè)每天都在使用這些算法制定關(guān)鍵決策。例如,媒體網(wǎng)站依靠機(jī)器學(xué)習(xí)算法從數(shù)百萬(wàn)種選項(xiàng)中篩選出為您推薦的歌曲或影片。零售商利用這些算法深入了解客戶的購(gòu)買行為。
何時(shí)應(yīng)該使用機(jī)器學(xué)習(xí)?
當(dāng)您遇到涉及大量數(shù)據(jù)和許多變量的復(fù)雜任務(wù)或問題,但沒有現(xiàn)成的處理公式或方程式時(shí),可以考慮使用機(jī)器學(xué)習(xí)。例如,如果您需要處理以下情況,使用機(jī)器學(xué)習(xí)是一個(gè)很好的選擇:
機(jī)器學(xué)習(xí)的工作原理
機(jī)器學(xué)習(xí)采用兩種技術(shù):監(jiān)督式學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。監(jiān)督式學(xué)習(xí)根據(jù)已知的輸入和輸出訓(xùn)練模型,讓模型能夠預(yù)測(cè)未來(lái)輸出;無(wú)監(jiān)督學(xué)習(xí)從輸入數(shù)據(jù)中找出隱藏模式或內(nèi)在結(jié)構(gòu)。
監(jiān)督式機(jī)器學(xué)習(xí)能夠根據(jù)已有的包含不確定性的數(shù)據(jù)建立一個(gè)預(yù)測(cè)模型。監(jiān)督式學(xué)習(xí)算法接受已知的輸入數(shù)據(jù)集(包含預(yù)測(cè)變量)和對(duì)該數(shù)據(jù)集的已知響應(yīng)(輸出,響應(yīng)變量),然后訓(xùn)練模型,使模型能夠?qū)π螺斎霐?shù)據(jù)的響應(yīng)做出合理的預(yù)測(cè)。
監(jiān)督式學(xué)習(xí)采用分類和回歸技術(shù)開發(fā)預(yù)測(cè)模型。
分類技術(shù)可預(yù)測(cè)離散的響應(yīng)—如果您的數(shù)據(jù)能進(jìn)行標(biāo)記、分類或分為特定的組或類,則使用分類。
用于實(shí)現(xiàn)分類的常用算法包括:支持向量機(jī) (SVM)、提升 (boosted) 決策樹和袋裝 (bagged)決策樹、k-最近鄰、樸素貝葉斯 (Na?ve Bayes)、判別分析、邏輯回歸和神經(jīng)網(wǎng)絡(luò)。
回歸技術(shù)可預(yù)測(cè)連續(xù)的響應(yīng)—如果您在處理一個(gè)數(shù)據(jù)范圍,或您的響應(yīng)性質(zhì)是一個(gè)實(shí)數(shù)(比如溫度,或一件設(shè)備發(fā)生故障前的運(yùn)行時(shí)間),則使用回歸方法。
常用回歸算法包括:線性模型、非線性模型、規(guī)則化、逐步回歸、提升 (boosted)和袋裝 (bagged)決策樹、神經(jīng)網(wǎng)絡(luò)和自適應(yīng)神經(jīng)模糊學(xué)習(xí)。
無(wú)監(jiān)督學(xué)習(xí)可發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式或內(nèi)在結(jié)構(gòu)。這種技術(shù)可根據(jù)未做標(biāo)記的輸入數(shù)據(jù)集得到推論。
聚類是一種最常用的無(wú)監(jiān)督學(xué)習(xí)技術(shù)。這種技術(shù)可通過探索性數(shù)據(jù)分析發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式或分組。
用于執(zhí)行聚類的常用算法包括:k-均值和 k-中心點(diǎn)(k-medoids)、層次聚類、高斯混合模型、隱馬爾可夫模型、自組織映射、模糊 c-均值聚類法和減法聚類。
入門視頻
在 MATLAB 微信公眾號(hào)回復(fù)【機(jī)器學(xué)習(xí)入門教程】,獲取《機(jī)器學(xué)習(xí)快速入門》系列視頻,全面介紹實(shí)用的 MATLAB 機(jī)器學(xué)習(xí)方法,包括:
線性回歸
判別分析
決策樹
支持向量機(jī)(SVM)
k近鄰算法(K-NN)
k均值聚類算法(k-means)
選擇合適的機(jī)器學(xué)習(xí)算法
沒有最佳方法或萬(wàn)全之策。找到正確的算法只是試錯(cuò)過程的一部分——即使是經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家,也無(wú)法說(shuō)出某種算法是否無(wú)需試錯(cuò)即可使用。但算法的選擇還取決于您要處理的數(shù)據(jù)的大小和類型、您要從數(shù)據(jù)中獲得的洞察力以及如何運(yùn)用這些洞察力。
下面是選擇監(jiān)督式或者無(wú)監(jiān)督機(jī)器學(xué)習(xí)的一些準(zhǔn)則:
在以下情況下選擇監(jiān)督式學(xué)習(xí):您需要訓(xùn)練模型進(jìn)行預(yù)測(cè)(例如溫度和股價(jià)等連續(xù)變量的值)或者分類(例如根據(jù)網(wǎng)絡(luò)攝像頭的錄像片段確定汽車的技術(shù)細(xì)節(jié))。
在以下情況下選擇無(wú)監(jiān)督學(xué)習(xí):您需要深入了解數(shù)據(jù)并希望訓(xùn)練模型找到好的內(nèi)部表示形式,例如將數(shù)據(jù)拆分到集群中。
MATLAB 機(jī)器學(xué)習(xí)
如何借助機(jī)器學(xué)習(xí)的力量,使用數(shù)據(jù)做出更好的決策?MATLAB 讓機(jī)器學(xué)習(xí)簡(jiǎn)單易行。借助用于處理大數(shù)據(jù)的工具和函數(shù),以及讓機(jī)器學(xué)習(xí)發(fā)揮作用的應(yīng)用程序,MATLAB 是將機(jī)器學(xué)習(xí)應(yīng)用于您的數(shù)據(jù)分析的理想環(huán)境。
使用 MATLAB,工程師和數(shù)據(jù)科學(xué)家可以立即訪問預(yù)置的函數(shù)、大量的工具箱以及用于分類、回歸和聚類的專門應(yīng)用程序。MATLAB 可以做到:
比較各種方法,例如邏輯回歸、分類樹、支持向量機(jī)、集成方法和深度學(xué)習(xí)。
使用模型精化和縮減技術(shù)創(chuàng)建能夠最好地捕捉預(yù)測(cè)能力的精確模型。
將機(jī)器學(xué)習(xí)模型集成到企業(yè)系統(tǒng)、集群和云中,并且將模型定位于實(shí)時(shí)嵌入式硬件。
為嵌入式傳感器分析工具執(zhí)行自動(dòng)代碼生成。
支持從數(shù)據(jù)分析到部署的集成工作流程。
有趣的應(yīng)用
機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)藝術(shù)鑒賞
小即是好—昆蟲大腦完勝機(jī)器學(xué)習(xí)
把 AI 基因植入您的工作流程
MATLAB 填補(bǔ)數(shù)據(jù)科學(xué)家的空白
-
集成方法
+關(guān)注
關(guān)注
0文章
3瀏覽量
6038 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132315 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1410瀏覽量
33987
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論