0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一篇文章告訴你機器學(xué)習(xí)用來干什么的

汽車玩家 ? 來源:CSDN ? 作者:ukakasu ? 2020-04-04 17:47 ? 次閱讀

前言

機器學(xué)習(xí)是什么,是用來干什么的?

機器學(xué)習(xí)就是樣本中有大量的x(特征量)和y(目標(biāo)變量)然后求這個function。

機器學(xué)習(xí)是讓機器尋找函數(shù)Y=f(X)的過程,使得當(dāng)我們給定一個X時,會返回我們想要得到的Y值。

例:

房價預(yù)測:X:位置、層數(shù) -》 Y:xxxx元/平

相親預(yù)測:X:高富帥、矮矬窮 -》 Y:見、不見

車牌識別:X:(車牌圖片)-》 Y:車牌號碼

機器翻譯:X:(中文) -》 Y:(英文)

語音識別:X:(一段語音)-》 Y:(一段文字)

聊天機器人:X:How are you -》 Y:IM fine

一、機器學(xué)習(xí)

大致可以把機器學(xué)習(xí)分為Supervised learning(監(jiān)督學(xué)習(xí))和Unsupervised learning(非監(jiān)督學(xué)習(xí))兩類。兩者區(qū)別在于訓(xùn)練樣本。

監(jiān)督學(xué)習(xí)( supervised learning): 這種方法使用已標(biāo)記數(shù)據(jù)來學(xué)習(xí),它使用的標(biāo)記數(shù)據(jù)可以是用戶對電影的評級(對推薦來說)、電影標(biāo)簽(對分類來說)或是收入數(shù)字(對回歸預(yù)測來說)。

無監(jiān)督學(xué)習(xí)( unsupervised learning): 一些模型的學(xué)習(xí)過程不需要標(biāo)記數(shù)據(jù),我們稱其為無監(jiān)督學(xué)習(xí)。這類模型試圖學(xué)習(xí)或是提取數(shù)據(jù)背后的結(jié)構(gòu)或從中抽取最為重要的特征。

監(jiān)督學(xué)習(xí)多用于回歸分析(求解是連續(xù)值,比如某一區(qū)間)和分類問題(求解是離散值,比如對錯)。非監(jiān)督學(xué)習(xí)初步多用于聚類算法(群分析)。

1. 監(jiān)督學(xué)習(xí)

1.1 回歸分析

初識:

“回歸于事物本來的面目”

出自高爾頓種豆子的實驗,通過大量數(shù)據(jù)統(tǒng)計,他發(fā)現(xiàn)個體小的豆子往往傾向于產(chǎn)生比其更大的子代,而個體大的豆子則傾向于產(chǎn)生比其小的子代,然后高爾頓認為這是由于新個體在向這種豆子的平均尺寸“回歸”,大概的意思就是事物總是傾向于朝著某種“平均”發(fā)展,也可以說是回歸于事物本來的面目。

進階:

線性回歸:

即y=ax+b,因變量和自變量為線性關(guān)系,輸出y為一具體數(shù)值,例如房價預(yù)測中的房價,產(chǎn)量預(yù)測中的產(chǎn)量等等,主要用于預(yù)測某一具體數(shù)值。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

邏輯回歸:

一個被logistic方程(sigmoid函數(shù),如下圖)歸一化后的線性回歸,將線性回歸輸出的很大范圍的數(shù),壓縮到0和1之間,這樣的輸出值表達為某一類別的概率,主要用于二分類問題。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

1.2 決策樹

初識:

相親預(yù)測:

決策樹分類的思想類似于找對象?,F(xiàn)想象一個女孩的母親要給這個女孩介紹男朋友,于是有了下面的對話:

女兒:多大年紀了?

母親:26。

女兒:長的帥不帥?

母親:挺帥的。

女兒:收入高不?

母親:不算很高,中等情況。

女兒:是公務(wù)員不?

母親:是,在稅務(wù)局上班呢。

女兒:那好,我去見見。

這個女孩的決策過程就是典型的分類樹決策。相當(dāng)于通過年齡、長相、收入和是否公務(wù)員對將男人分為兩個類別:見和不見。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

其中綠色節(jié)點表示判斷條件,橙色節(jié)點表示決策結(jié)果,箭頭表示在一個判斷條件在不同情況下的決策路徑。

進階:

決策樹(decision tree)是一個樹結(jié)構(gòu)。其每個非葉節(jié)點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節(jié)點存放一個類別。使用決策樹進行決策的過程就是從根節(jié)點開始,測試待分類項中相應(yīng)的特征屬性,并按照其值選擇輸出分支,直到到達葉子節(jié)點,將葉子節(jié)點存放的類別作為決策結(jié)果。

1.3 隨機森林

初識:

“三個臭皮匠頂過諸葛亮”

隨機森林中的每一棵決策樹可以理解為一個精通于某一個窄領(lǐng)域的專家,這樣在隨機森林中就有了很多個精通不同領(lǐng)域的專家,對一個新的問題(新的輸入數(shù)據(jù)),可以用不同的角度去看待它,最終由各個專家投票得到結(jié)果。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

進階:

隨機森林通過自助法(bootstrap)重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機抽取k個樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自助樣本集生成k個分類樹組成隨機森林,新數(shù)據(jù)的分類結(jié)果按分類樹投票多少形成的分數(shù)而定。

隨機森林可以用于分類和回歸。當(dāng)因變量Y是分類變量時,是分類;當(dāng)因變量Y是連續(xù)變量時,是回歸。

1.4 樸素貝葉斯

初識:

貝葉斯公式:

已知某種疾病的發(fā)病率是0.001,即1000人中會有1個人得病?,F(xiàn)有一種試劑可以檢驗患者是否得病,它的準(zhǔn)確率是0.99,即在患者確實得病的情況下,它有99%的可能呈現(xiàn)陽性。它的誤報率是5%,即在患者沒有得病的情況下,它有5%的可能呈現(xiàn)陽性。現(xiàn)有一個病人的檢驗結(jié)果為陽性,請問他確實得病的可能性有多大?

P(A|B)約等于0.019。也就是說,即使檢驗呈現(xiàn)陽性,病人得病的概率:也只從0.1%增加到了2%左右。這就是所謂的“假陽性”,即陽性結(jié)果完全不足以說明病人得病。

進階:

對于給出的待分類項,求解在此項特征出現(xiàn)的條件下各個類別出現(xiàn)的概率,哪個最大,就認為此待分類項屬于哪個類別。

比如輸入法里的錯拼也能搜出正確的詞,根據(jù)輸入的字母及其周邊可能出現(xiàn)的字母出現(xiàn)的概率,推薦出最符合想輸入的詞組。

1.5 支持向量機

初識:

一篇文章告訴你機器學(xué)習(xí)用來干什么的

一個普通的支持向量機(SVM)就是一條直線,用來完美劃分線性分割的兩類。但這又不是一條普通的直線,這是無數(shù)條可以分類的直線當(dāng)中最完美的,因為它恰好在兩個類的中間,距離兩個類的點都一樣遠。而所謂的支持向量就是這些離分界線最近的『點』。如果去掉這些點,直線多半是要改變位置的??梢哉f是這些vectors(主,點)support(謂,定義)了machine(賓,分類器)。

進階:

在線性不可分的情況下,支持向量機通過某種事先選擇的非線性映射(核函數(shù))將輸入變量映射到一個高維特征空間,在這個空間中構(gòu)造最優(yōu)分類超平面。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

2. 非監(jiān)督學(xué)習(xí)

2.1 Kmeans

初識:

“人以類聚,物以群分”

例:你左手在地上撒一把鹽,右手在地上撒一把糖。假設(shè)你分不清鹽和糖,但是你分別是用左右手撒的,所以兩個東西位置不同,你就可以通過倆玩意的位置,判斷出兩個東西是兩類(左手撒的,右手撒的)。然而能不能區(qū)別出是糖還是鹽?不行。你只能分出這是兩類而已。但是分成兩類以后再去分析,就比撒地上一堆分析容易多了。

聚類分析主要就是把大類分為小類,然后再人工的對每一小類進行分析。

進階:

K-均值是把數(shù)據(jù)集按照k個簇分類,其中k是用戶給定的,其中每個簇是通過質(zhì)心來計算簇的中心點。

首先創(chuàng)建一個初始劃分,隨機地選擇 k 個對象(中心點),每個對象初始地代表了一個簇中心。對于其他的對象,根據(jù)其與各個簇中心的距離,將它們賦給最近的簇,然后重新計算簇的平均值,將每個簇的平均值重新作為中心點,然后對對象進行重新分配。這個過程不斷重復(fù),直到?jīng)]有簇中對象的變化。

一篇文章告訴你機器學(xué)習(xí)用來干什么的

上圖中,A,B,C,D,E是五個聚類點,灰色的點是質(zhì)心點,聚為兩類。

(1)隨機在圖中取K(這里K=2)個種子點。

(2)然后對圖中的所有點求到這K個種子點的距離,假如點Pi離種子點Si最近,那么Pi屬于Si點群。(上圖中,我們可以看到A,B屬于上面的種子點,C,D,E屬于下面中部的種子點)

(3)接下來,我們要移動種子點到屬于他的“點群”的中心。(見圖上的第三步)

(4)然后重復(fù)第2)和第3)步,直到,種子點沒有移動(我們可以看到圖中的第四步上面的種子點聚合了A,B,C,下面的種子點聚合了D,E)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 變量
    +關(guān)注

    關(guān)注

    0

    文章

    613

    瀏覽量

    28308
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8353

    瀏覽量

    132315
收藏 人收藏

    評論

    相關(guān)推薦

    電視上的usb是用來干什么的

    電視上的USB接口是個非常實用的功能,它允許用戶通過USB設(shè)備(如U盤、移動硬盤等)直接播放存儲在這些設(shè)備上的多媒體文件,如視頻、音頻、圖片等。此外,USB接口還可以用來為電視提供額外的功能,比如
    的頭像 發(fā)表于 10-12 10:06 ?1146次閱讀

    LM318 COMP管腳是什么引腳,干什么用的?

    LM318 COMP 管腳是什么引腳,干什么用的,PSPICEFORTI 里面沒有318的COMP管腳在怎么應(yīng)用
    發(fā)表于 07-31 07:45

    音圈電機是用來干什么的

    音圈電機(Voice Coil Motor,簡稱VCM)是種利用電磁原理將電能轉(zhuǎn)換為直線運動的電機。它廣泛應(yīng)用于各種精密定位系統(tǒng)和驅(qū)動設(shè)備中,如硬盤驅(qū)動器、光盤驅(qū)動器、光學(xué)掃描儀、精密定位臺等
    的頭像 發(fā)表于 06-13 11:03 ?595次閱讀

    串口的空閑字符是用來激活空閑中斷的嗎?

    發(fā)送空閑幀。 \" [size=13.3333px]請問般這個東西是怎么用的? [size=13.3333px]用來干什么的? [size=13.3333px]不知道該怎么激活這個中斷,有傳統(tǒng)庫的demo嗎?
    發(fā)表于 05-11 07:28

    美國云服務(wù)器是干什么的

    美國云服務(wù)器主要用于提供計算資源、托管網(wǎng)站、應(yīng)用程序以及存儲數(shù)據(jù)等。很多用戶想要了解美國云服務(wù)器具體是干什么的,rak部落小編為您整理發(fā)布美國云服務(wù)器是干什么的。 美國云服務(wù)器是種**基于云
    的頭像 發(fā)表于 04-10 10:16 ?389次閱讀

    合宙功耗分析儀Air9000是用來干什么的?

    合宙功耗分析儀Air9000,字如其名,就是用來測試電子產(chǎn)品的功耗的。
    的頭像 發(fā)表于 03-28 13:37 ?932次閱讀
    合宙功耗分析儀Air9000是<b class='flag-5'>用來</b><b class='flag-5'>干什么的</b>?

    美國云服務(wù)器是干什么的

    對于美國服務(wù)器是干什么的,相信很多小白用戶不是非常了解,接下來小編就為您整理發(fā)布美國云服務(wù)器是干什么的相關(guān)資訊,希望對您有幫助。
    的頭像 發(fā)表于 02-19 09:53 ?399次閱讀

    云服務(wù)器是干什么的

     云服務(wù)器是干什么的?很多小白用戶會有疑惑,今天小編為您整理云服務(wù)器是干什么的相關(guān)資料,希望對您了解云服務(wù)器是干什么的有幫助。
    的頭像 發(fā)表于 02-18 09:58 ?1430次閱讀

    電磁爐工作原理 電磁爐板上有個可調(diào)電位器的作用是干什么的?

    電磁爐工作原理 電磁爐板上有個可調(diào)電位器的作用是干什么的? 電磁爐是種利用電磁感應(yīng)原理來加熱食物的廚房電器。其工作原理是通過電路中的電感線圈產(chǎn)生高頻交變電磁場,使鐵制的鑲嵌在爐板下方的發(fā)熱盤產(chǎn)生
    的頭像 發(fā)表于 02-05 10:29 ?2082次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別有哪些

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別 GPU服務(wù)器是種專門用于處理圖形運算的服務(wù)器,而CPU服務(wù)器則是種處理通用計算任務(wù)的服務(wù)器。它們之間的主要區(qū)別在于服務(wù)器所搭載的主要
    的頭像 發(fā)表于 01-30 15:31 ?787次閱讀

    什么是溫補晶振?溫補晶振是干什么的?

    什么是溫補晶振?溫補晶振是干什么的?? 溫補晶振是指對晶體振蕩器進行溫度補償?shù)?b class='flag-5'>一種技術(shù)。晶體振蕩器是種電子設(shè)備,通過驅(qū)動晶體諧振頻率上的機械振動來產(chǎn)生穩(wěn)定的電信號。它在現(xiàn)代電子設(shè)備中廣泛應(yīng)用,如
    的頭像 發(fā)表于 01-23 16:42 ?1016次閱讀

    云服務(wù)器是干什么的?服務(wù)器的主要功能有哪些?

    云服務(wù)器是干什么的,主要功能是什么?相信很多技術(shù)人員已經(jīng)很了解,但是對于其他行業(yè)的人群云服務(wù)器又有什么用呢?擁有云服務(wù)器有什么用處呢,RAKsmart小編今天來為您做詳細的解答。
    的頭像 發(fā)表于 01-09 09:48 ?679次閱讀

    LCR數(shù)字電橋的原理是什么?LCR數(shù)字電橋是用來干什么的

    LCR數(shù)字電橋的原理是什么?LCR數(shù)字電橋是用來干什么的? LCR數(shù)字電橋原理的詳解 LCR數(shù)字電橋是種測試電路中被稱為LCR元件的電感、電容和電阻的值的儀器。通過測量該元件在不同頻率下的電壓
    的頭像 發(fā)表于 12-21 15:37 ?2382次閱讀

    混合矩陣是干什么用的?高清混合矩陣怎么使用?

    混合矩陣是干什么用的?高清混合矩陣怎么使用? 混合矩陣(confusion matrix),也被稱為錯誤矩陣(error matrix),是用來評估分類模型性能的種工具。它可以對分類算法的結(jié)果進行
    的頭像 發(fā)表于 12-04 14:40 ?993次閱讀

    Thread是什么?Thread可以與Wi-Fi、以太網(wǎng)等通信嗎?

    看了下面這張圖,便可大概了解Thread是干什么的。
    的頭像 發(fā)表于 11-20 09:19 ?5188次閱讀
    Thread是什么?Thread可以與Wi-Fi、以太網(wǎng)等通信嗎?