0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)算法的介紹

新機(jī)器視覺(jué) ? 來(lái)源:機(jī)器人網(wǎng) ? 作者:機(jī)器人網(wǎng) ? 2022-06-05 14:17 ? 次閱讀

b16add9c-e171-11ec-ba43-dac502259ad0.jpg

哲學(xué)要回答的基本問(wèn)題是從哪里來(lái)、我是誰(shuí)、到哪里去,尋找答案的過(guò)程或許可以借鑒機(jī)器學(xué)習(xí)的套路:組織數(shù)據(jù)->挖掘知識(shí)->預(yù)測(cè)未來(lái)。組織數(shù)據(jù)即為設(shè)計(jì)特征,生成滿(mǎn)足特定格式要求的樣本,挖掘知識(shí)即建模,而預(yù)測(cè)未來(lái)就是對(duì)模型的應(yīng)用。

b19a7a7a-e171-11ec-ba43-dac502259ad0.jpg

特征設(shè)計(jì)依賴(lài)于對(duì)業(yè)務(wù)場(chǎng)景的理解,可分為連續(xù)特征、離散特征和組合高階特征。本篇重點(diǎn)是機(jī)器學(xué)習(xí)算法的介紹,可以分為監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)兩大類(lèi)。

b1bf5246-e171-11ec-ba43-dac502259ad0.jpg

無(wú)監(jiān)督學(xué)習(xí)算法很多,最近幾年業(yè)界比較關(guān)注主題模型,LSA->PLSA->LDA為主題模型三個(gè)發(fā)展階段的典型算法,它們主要是建模假設(shè)條件上存在差異。LSA假設(shè)文檔只有一個(gè)主題,PLSA假設(shè)各個(gè)主題的概率分布不變(theta都是固定的),LDA假設(shè)每個(gè)文檔和詞的主題概率是可變的。

b20f703c-e171-11ec-ba43-dac502259ad0.jpg

LDA算法本質(zhì)可以借助上帝擲骰子幫助理解,詳細(xì)內(nèi)容可參加Rickjin寫(xiě)的《LDA數(shù)據(jù)八卦》文章,淺顯易懂,順便也科普了很多數(shù)學(xué)知識(shí),非常推薦。

b24f76dc-e171-11ec-ba43-dac502259ad0.jpg

監(jiān)督學(xué)習(xí)可分為分類(lèi)和回歸,感知器是最簡(jiǎn)單的線(xiàn)性分類(lèi)器,現(xiàn)在實(shí)際應(yīng)用比較少,但它是神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的基本單元。

b27c3f82-e171-11ec-ba43-dac502259ad0.jpg

線(xiàn)性函數(shù)擬合數(shù)據(jù)并基于閾值分類(lèi)時(shí),很容易受噪聲樣本的干擾,影響分類(lèi)的準(zhǔn)確性。邏輯回歸(Logistic Regression)利用sigmoid函數(shù)將模型輸出約束在0到1之間,能夠有效弱化噪聲數(shù)據(jù)的負(fù)面影響,被廣泛應(yīng)用于互聯(lián)網(wǎng)廣告點(diǎn)擊率預(yù)估。

b2c56c20-e171-11ec-ba43-dac502259ad0.jpg

b2e98e48-e171-11ec-ba43-dac502259ad0.jpg

邏輯回歸模型參數(shù)可以通過(guò)最大似然求解,首先定義目標(biāo)函數(shù)L(theta),然后log處理將目標(biāo)函數(shù)的乘法邏輯轉(zhuǎn)化為求和邏輯(最大化似然概率 -> 最小化損失函數(shù)),最后采用梯度下降求解。

b301a604-e171-11ec-ba43-dac502259ad0.jpg

b326e1f8-e171-11ec-ba43-dac502259ad0.jpg

相比于線(xiàn)性分類(lèi)去,決策樹(shù)等非線(xiàn)性分類(lèi)器具有更強(qiáng)的分類(lèi)能力,ID3和C4.5是典型的決策樹(shù)算法,建模流程基本相似,兩者主要在增益函數(shù)(目標(biāo)函數(shù))的定義不同。

b34b38dc-e171-11ec-ba43-dac502259ad0.jpg

線(xiàn)性回歸和線(xiàn)性分類(lèi)在表達(dá)形式上是類(lèi)似的,本質(zhì)區(qū)別是分類(lèi)的目標(biāo)函數(shù)是離散值,而回歸的目標(biāo)函數(shù)是連續(xù)值。目標(biāo)函數(shù)的不同導(dǎo)致回歸通?;谧钚《硕x目標(biāo)函數(shù),當(dāng)然,在觀(guān)測(cè)誤差滿(mǎn)足高斯分布的假設(shè)情況下,最小二乘和最大似然可以等價(jià)。

b370df42-e171-11ec-ba43-dac502259ad0.jpg

當(dāng)梯度下降求解模型參數(shù)時(shí),可以采用Batch模式或者Stochastic模式,通常而言,Batch模式準(zhǔn)確性更高,Stochastic模式復(fù)雜度更低。

b38d0ee2-e171-11ec-ba43-dac502259ad0.jpg

b3ed7ba6-e171-11ec-ba43-dac502259ad0.jpg

上文已經(jīng)提到,感知器雖然是最簡(jiǎn)單的線(xiàn)性分類(lèi)器,但是可以視為深度學(xué)習(xí)的基本單元,模型參數(shù)可以由自動(dòng)編碼(Auto Encoder)等方法求解。

b42f756a-e171-11ec-ba43-dac502259ad0.jpg

深度學(xué)習(xí)的優(yōu)勢(shì)之一可以理解為特征抽象,從底層特征學(xué)習(xí)獲得高階特征,描述更為復(fù)雜的信息結(jié)構(gòu)。例如,從像素層特征學(xué)習(xí)抽象出描述紋理結(jié)構(gòu)的邊緣輪廓特征,更進(jìn)一步學(xué)習(xí)獲得表征物體局部的更高階特征。 俗話(huà)說(shuō)三個(gè)臭皮匠賽過(guò)諸葛亮,無(wú)論是線(xiàn)性分類(lèi)還是深度學(xué)習(xí),都是單個(gè)模型算法單打獨(dú)斗,有沒(méi)有一種集百家之長(zhǎng)的方法,將模型處理數(shù)據(jù)的精度更進(jìn)一步提升呢?當(dāng)然,Model Ensembel就是解決這個(gè)問(wèn)題。Bagging為方法之一,對(duì)于給定數(shù)據(jù)處理任務(wù),采用不同模型/參數(shù)/特征訓(xùn)練多組模型參數(shù),最后采用投票或者加權(quán)平均的方式輸出最終結(jié)果。 Boosting為Model Ensemble的另外一種方法,其思想為模型每次迭代時(shí)通過(guò)調(diào)整錯(cuò)誤樣本的損失權(quán)重提升對(duì)數(shù)據(jù)樣本整體的處理精度,典型算法包括AdaBoost、GBDT等。

b4591816-e171-11ec-ba43-dac502259ad0.jpg

不同的數(shù)據(jù)任務(wù)場(chǎng)景,可以選擇不同的Model Ensemble方法,對(duì)于深度學(xué)習(xí),可以對(duì)隱層節(jié)點(diǎn)采用DropOut的方法實(shí)現(xiàn)類(lèi)似的效果。

b4823dea-e171-11ec-ba43-dac502259ad0.jpg

b4a5cb84-e171-11ec-ba43-dac502259ad0.jpg

b4cc1172-e171-11ec-ba43-dac502259ad0.jpg

介紹了這么多機(jī)器學(xué)習(xí)基礎(chǔ)算法,說(shuō)一說(shuō)評(píng)價(jià)模型優(yōu)劣的基本準(zhǔn)則。欠擬合和過(guò)擬合是經(jīng)常出現(xiàn)的兩種情況,簡(jiǎn)單的判定方法是比較訓(xùn)練誤差和測(cè)試誤差的關(guān)系,當(dāng)欠擬合時(shí),可以設(shè)計(jì)更多特征來(lái)提升模型訓(xùn)練精度,當(dāng)過(guò)擬合時(shí),可以?xún)?yōu)化特征量降低模型復(fù)雜度來(lái)提升模型測(cè)試精度。

b4f27376-e171-11ec-ba43-dac502259ad0.jpg

特征量是模型復(fù)雜度的直觀(guān)反映,模型訓(xùn)練之前設(shè)定輸入的特征量是一種方法,另外一種比較常用的方法是在模型訓(xùn)練過(guò)程中,將特征參數(shù)的正則約束項(xiàng)引入目標(biāo)函數(shù)/損失函數(shù),基于訓(xùn)練過(guò)程篩選優(yōu)質(zhì)特征。

b511daae-e171-11ec-ba43-dac502259ad0.jpg

模型調(diào)優(yōu)是一個(gè)細(xì)致活,最終還是需要能夠?qū)?shí)際場(chǎng)景給出可靠的預(yù)測(cè)結(jié)果,解決實(shí)際問(wèn)題。期待學(xué)以致用!

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4588

    瀏覽量

    92506
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8353

    瀏覽量

    132315

原文標(biāo)題:零基礎(chǔ)入門(mén)機(jī)器學(xué)習(xí)算法(附圖)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類(lèi)似人類(lèi)智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2423次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    LIBS結(jié)合機(jī)器學(xué)習(xí)算法的江西名優(yōu)春茶采收期鑒別

    以廬山云霧茶和狗牯腦茶的明前茶、雨前茶為對(duì)象,研究激光誘導(dǎo)擊穿光譜結(jié)合機(jī)器學(xué)習(xí)的茶葉鑒別方法。將茶葉茶,水?dāng)?shù)據(jù)融合可有效鑒別春茶采收期,且數(shù)據(jù)融合后表現(xiàn)出更好的穩(wěn)定性和魯棒性,LIBS結(jié)合機(jī)器
    的頭像 發(fā)表于 10-22 18:05 ?172次閱讀
    LIBS結(jié)合<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>的江西名優(yōu)春茶采收期鑒別

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書(shū)概覽與時(shí)間序列概述

    如何通過(guò)根因分析技術(shù)獲得導(dǎo)致故障的維度和元素,包括基于時(shí)間序列異常檢測(cè)算法的根因分析、基于熵的根因分析、基于樹(shù)模型的根因分析、規(guī)則學(xué)習(xí)等。 ●第7章“智能運(yùn)維的應(yīng)用場(chǎng)景”:介紹智能運(yùn)維領(lǐng)域的應(yīng)用,包括
    發(fā)表于 08-07 23:03

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?672次閱讀

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過(guò)訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的數(shù)據(jù)分析能力。本文將深入探討機(jī)器
    的頭像 發(fā)表于 07-02 11:22 ?522次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1105次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集,在統(tǒng)計(jì)學(xué)習(xí)
    的頭像 發(fā)表于 06-27 08:27 ?1546次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典<b class='flag-5'>算法</b>與應(yīng)用

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來(lái)?

    應(yīng)用,將理論基礎(chǔ)與實(shí)踐案例相結(jié)合,作者憑借扎實(shí)的數(shù)學(xué)功底及其在企業(yè)界的豐富實(shí)踐經(jīng)驗(yàn),將機(jī)器學(xué)習(xí)與時(shí)間序列分析巧妙融合在書(shū)中。 全書(shū)書(shū)共分為8章,系統(tǒng)介紹時(shí)間序列的基礎(chǔ)知識(shí)、常用預(yù)測(cè)方法、異常檢測(cè)
    發(fā)表于 06-25 15:00

    機(jī)器學(xué)習(xí)入門(mén):基本概念介紹

    機(jī)器學(xué)習(xí)(GraphMachineLearning,簡(jiǎn)稱(chēng)GraphML)是機(jī)器學(xué)習(xí)的一個(gè)分支,專(zhuān)注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中,數(shù)據(jù)以圖的形式表示,其中的節(jié)點(diǎn)(或頂點(diǎn))表示實(shí)體
    的頭像 發(fā)表于 05-16 08:27 ?463次閱讀
    圖<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):基本概念<b class='flag-5'>介紹</b>

    深入探討機(jī)器學(xué)習(xí)的可視化技術(shù)

    機(jī)器學(xué)習(xí)可視化(簡(jiǎn)稱(chēng)ML可視化)一般是指通過(guò)圖形或交互方式表示機(jī)器學(xué)習(xí)模型、數(shù)據(jù)及其關(guān)系的過(guò)程。目標(biāo)是使理解模型的復(fù)雜算法和數(shù)據(jù)模式更容易,
    發(fā)表于 04-25 11:17 ?353次閱讀
    深入探討<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的可視化技術(shù)

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門(mén)領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語(yǔ)音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是一類(lèi)基于樣本數(shù)據(jù)和模型訓(xùn)練來(lái)進(jìn)行預(yù)測(cè)和判斷的
    的頭像 發(fā)表于 04-04 08:41 ?232次閱讀

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱(chēng)為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實(shí)現(xiàn)最佳性能。
    的頭像 發(fā)表于 03-23 08:26 ?551次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    AI算法的本質(zhì)是模擬人類(lèi)智能,讓機(jī)器實(shí)現(xiàn)智能化

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI算法是人工智能領(lǐng)域中使用的算法,用于模擬、延伸和擴(kuò)展人的智能。這些算法可以通過(guò)機(jī)器學(xué)習(xí)、深度
    的頭像 發(fā)表于 02-07 00:07 ?5540次閱讀

    目前主流的深度學(xué)習(xí)算法模型和應(yīng)用案例

    深度學(xué)習(xí)在科學(xué)計(jì)算中獲得了廣泛的普及,其算法被廣泛用于解決復(fù)雜問(wèn)題的行業(yè)。所有深度學(xué)習(xí)算法都使用不同類(lèi)型的神經(jīng)網(wǎng)絡(luò)來(lái)執(zhí)行特定任務(wù)。
    的頭像 發(fā)表于 01-03 10:28 ?1655次閱讀
    目前主流的深度<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>模型和應(yīng)用案例

    常用的十大機(jī)器學(xué)習(xí)算法介紹

    Boosting是一種集成技術(shù),嘗試從多個(gè)弱分類(lèi)器創(chuàng)建強(qiáng)分類(lèi)器。這是通過(guò)從訓(xùn)練數(shù)據(jù)構(gòu)建模型,然后創(chuàng)建第二個(gè)模型來(lái)嘗試糾正第一個(gè)模型中的錯(cuò)誤來(lái)完成的。添加模型,直到完美預(yù)測(cè)訓(xùn)練集或添加最大數(shù)量的模型為止。
    發(fā)表于 11-20 14:49 ?389次閱讀
    常用的十大<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b><b class='flag-5'>介紹</b>