0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習技術(shù)的理論背景

星星科技指導員 ? 來源:嵌入式計算設(shè)計 ? 作者:Sorin Mihai ? 2022-12-02 14:53 ? 次閱讀

機器學習可以定義為一組算法,有助于根據(jù)過去的學習進行預測。

在機器學習算法中,輸入數(shù)據(jù)被組織為數(shù)據(jù)點。每個數(shù)據(jù)點都由描述所表示數(shù)據(jù)的特征組成。例如,尺寸和速度是可以將汽車與街道上的自行車區(qū)分開來的特征。汽車的大小和速度通常都高于自行車。機器學習方法的目標是將輸入數(shù)據(jù)轉(zhuǎn)換為有意義的輸出,例如將輸入數(shù)據(jù)分類為汽車和非汽車數(shù)據(jù)點或?qū)ο?。輸入通常寫為向量,由多個數(shù)據(jù)點組成。輸出寫為。xy

二維或三維輸入數(shù)據(jù)可以在所謂的特征空間中進行說明和查看,其中每個數(shù)據(jù)點都相對于其特征繪制。圖 8 (a) 顯示了描述汽車和非汽車對象的二維特征空間的簡化示例。x

pYYBAGOJoQyAbFX-AADvWuiesyU971.png

圖8.根據(jù)汽車和非汽車物體的大小和速度對汽車和非汽車對象進行分類:特征空間(a)以及兩個類(b)之間的相應間隔。

所謂的學習映射函數(shù)或,給出特征向量之間的差異(例如,分類為汽車和非汽車數(shù)據(jù)點)。該模型的結(jié)構(gòu)范圍從簡單的線性函數(shù)(例如圖 8 (a) 中的汽車和非汽車對象的線劃分)到復雜的非線性神經(jīng)網(wǎng)絡(luò)。學習方法的目標是確定系數(shù)的值,這些系數(shù)表示可用輸入數(shù)據(jù)中的模型參數(shù)。映射函數(shù)的輸出是算法對輸入數(shù)據(jù)描述內(nèi)容的預測。model,h_θ (x)θ-

機器學習方法可以根據(jù)映射函數(shù)的學習方式進行分類(圖 9)。有三種可能性:

監(jiān)督學習 –映射函數(shù)是根據(jù)訓練數(shù)據(jù)對計算的,其中預先知道的輸出在訓練階段單獨提供給學習算法。計算出模型參數(shù)后,可以將模型部署到目標應用程序中。當它收到未知數(shù)據(jù)點時,它的輸出將是預測值。yy

無監(jiān)督學習 –在這種情況下,與監(jiān)督學習相比,在訓練階段沒有可用的特征標簽對。學習算法的輸入僅包含未標記的數(shù)據(jù)點。這種機器學習方法的目標是直接從輸入特征在特征空間中的分布中推斷出輸入特征的標簽。x

強化(半監(jiān)督)學習 –在這種情況下,訓練數(shù)據(jù)也沒有標簽,但構(gòu)建模型是為了通過一組操作促進與其環(huán)境的交互。映射函數(shù)將環(huán)境的狀態(tài)映射到操作,該狀態(tài)由輸入數(shù)據(jù)提供給操作。獎勵信號指示操作在環(huán)境的特定狀態(tài)下的性能。當信號表明積極影響時,學習算法會加強動作。如果識別出負面影響,該算法將阻止環(huán)境的特定操作或狀態(tài)。

poYBAGOJoRKAcNGOAAC6Ms7t080094.png

圖9.基于訓練方法的機器學習算法分類。

深度學習革命

近年來,所謂的深度學習范式徹底改變了機器學習領(lǐng)域。深度學習通過解決以前傳統(tǒng)模式識別方法無法解決的挑戰(zhàn),對機器學習社區(qū)產(chǎn)生了巨大影響(LeCun et al. 2015)。深度學習的引入極大地提高了專為視覺識別、對象檢測、語音識別、異常檢測或基因組學而設(shè)計的系統(tǒng)精度。深度學習的關(guān)鍵方面是,用于解釋數(shù)據(jù)的特征是從訓練數(shù)據(jù)中自動學習的,而不是由工程師手動制作的。

pYYBAGOJoRiAHmdEAAFZ8FQXLFk467.png

圖 10.經(jīng)過訓練的深度卷積神經(jīng)網(wǎng)絡(luò)可以識別圖像中的汽車。

到目前為止,構(gòu)建良好的模式識別算法的主要挑戰(zhàn)是手動設(shè)計用于分類的手工制作的特征向量,例如早期版本的交通標志識別系統(tǒng)中使用的局部二進制模式,如第 1 部分所述。深度學習的出現(xiàn)已經(jīng)用學習算法取代了特征向量的手動工程,該算法可以自動發(fā)現(xiàn)原始輸入數(shù)據(jù)中的重要特征。

在架構(gòu)上,深度學習系統(tǒng)由多層非線性單元組成,可以將原始輸入數(shù)據(jù)轉(zhuǎn)換為更高級別的抽象。每個層將前一層的輸出映射到適用于回歸或分類任務的更復雜的表示中。這種學習通常在深度神經(jīng)網(wǎng)絡(luò)上進行,該網(wǎng)絡(luò)通過使用反向傳播算法進行訓練。該算法迭代地調(diào)整網(wǎng)絡(luò)的參數(shù)或權(quán)重,以模擬輸入訓練數(shù)據(jù)。因此,網(wǎng)絡(luò)在訓練結(jié)束時學習了輸入數(shù)據(jù)點的復雜非線性映射函數(shù)。

圖 10 顯示了深度神經(jīng)網(wǎng)絡(luò)的符號表示,該網(wǎng)絡(luò)經(jīng)過訓練以識別圖像中的汽車。輸入層表示原始輸入像素。隱藏層 1 通常模擬圖像某些位置和方向中邊緣的存在與否。第二個隱藏層使用在前一層中計算的邊對對象零件進行建模。第三個隱藏層構(gòu)建了建模對象的抽象表示,在我們的例子中,這是汽車的成像方式。輸出層根據(jù)第三個隱藏層的高級特征計算給定圖像包含汽車的概率。

不同的網(wǎng)絡(luò)架構(gòu)源于神經(jīng)網(wǎng)絡(luò)的單元和層的分布方式。所謂的感知器是最簡單的,由單個輸出神經(jīng)元組成。通過構(gòu)建感知器可以獲得大量的神經(jīng)網(wǎng)絡(luò)風格。這些網(wǎng)絡(luò)中的每一個都比其他網(wǎng)絡(luò)更適合特定的應用程序。圖 11 顯示了近年來創(chuàng)建的眾多神經(jīng)網(wǎng)絡(luò)架構(gòu)中最常見的三種。

深度前饋神經(jīng)網(wǎng)絡(luò)(圖11a)是一種結(jié)構(gòu),其中兩個相鄰層之間的神經(jīng)元完全互連,并且信息流僅在一個方向上,從系統(tǒng)的輸入到輸出。這些網(wǎng)絡(luò)可用作通用分類器,并用作所有其他類型的深度神經(jīng)系統(tǒng)的基礎(chǔ)。

pYYBAGOJoR6AZdV3AAHCD7wYZyk704.png

圖 11.深度神經(jīng)網(wǎng)絡(luò)架構(gòu)(來源:www.asimovinstitute.org)

深度卷積神經(jīng)網(wǎng)絡(luò)(圖11b)改變了視覺感知方法的發(fā)展方式。此類網(wǎng)絡(luò)由交替的卷積層和池化層組成,這些層通過從輸入數(shù)據(jù)進行泛化來自動學習對象特征。這些學習到的特征被傳遞到一個完全互連的前饋網(wǎng)絡(luò)進行分類。這種類型的卷積網(wǎng)絡(luò)是圖 10 所示汽車檢測架構(gòu)和第1 部分描述的用例的基礎(chǔ)。

雖然深度卷積網(wǎng)絡(luò)對視覺識別至關(guān)重要,但深度遞歸神經(jīng)網(wǎng)絡(luò)(圖11c)對于自然語言處理至關(guān)重要。由于隱藏層中神經(jīng)元之間的自遞歸連接,這種架構(gòu)中的信息是時間依賴性的。網(wǎng)絡(luò)的輸出可能因數(shù)據(jù)饋入網(wǎng)絡(luò)的順序而異。例如,如果在單詞“mouse”之前輸入單詞“cat”,則會獲得一定的輸出?,F(xiàn)在,如果輸入順序發(fā)生變化,輸出順序也可能更改。

機器學習算法的類型

盡管深度神經(jīng)網(wǎng)絡(luò)是復雜機器學習挑戰(zhàn)中最常用的解決方案之一,但還有各種其他類型的機器學習算法可用。表1根據(jù)其性質(zhì)(連續(xù)或離散)和訓練類型(有監(jiān)督或無監(jiān)督)對它們進行分類。

poYBAGOJoSaAHXsZAAG92O9k-nc143.png

表 1.機器學習算法的類型

機器學習估計器可以根據(jù)其輸出值或訓練方法大致分類。如果后者估計連續(xù)值函數(shù)(即連續(xù)輸出),則該算法被歸類為回歸估計器。當機器學習算法的輸出是離散變量時,該算法稱為分類器。第 1 部分中描述的交通標志檢測和識別系統(tǒng)是此類算法的實現(xiàn)。y

? Ry ? {0,1,…,q}

異常檢測是無監(jiān)督學習的一種特殊應用。此處的目標是識別數(shù)據(jù)集中的異常值或異常。異常值定義為特征向量,與應用程序中常見的特征向量相比,這些特征向量具有不同的屬性。換句話說,它們在特征空間中占據(jù)不同的位置。

表 1 還列出了一些流行的機器學習算法。下面簡要解釋這些內(nèi)容。

線性回歸是一種回歸方法,用于將線、平面或超平面擬合到數(shù)據(jù)集。擬合模型是一個線性函數(shù),可用于對實值函數(shù)進行預測。y

邏輯回歸是線性回歸方法的離散對應物,其中映射函數(shù)給出的預測實際值被轉(zhuǎn)換為概率輸出,該輸出表示輸入數(shù)據(jù)點對某個類的成員資格。

樸素貝葉斯分類器是一組基于貝葉斯定理構(gòu)建的機器學習方法,該定理假設(shè)每個特征都獨立于其他特征。

支持向量機 (SVM) 旨在使用所謂的邊距計算類之間的分離。邊距的計算盡可能寬,以便盡可能清楚地分隔類。

集成方法,如決策樹、運行dom 森林或AdaBoost組合了一組基礎(chǔ)分類器,有時稱為“弱”學習器,目的是獲得“強”分類器。

神經(jīng)網(wǎng)絡(luò)是機器學習算法,其中回歸或分類問題由一組稱為神經(jīng)元的互連單元解決。從本質(zhì)上講,神經(jīng)網(wǎng)絡(luò)試圖模仿人腦的功能。

K-均值聚類是一種用于將具有共同屬性的特征分組在一起的方法,即它們在特征空間中彼此接近。k 均值根據(jù)要分組的給定聚類數(shù),以迭代方式將常見要素分組到球形聚類中。

均值偏移也是一種數(shù)據(jù)聚類技術(shù),對于異常值而言,該技術(shù)更為通用和穩(wěn)健。與 k 均值相反,均值偏移只需要一個優(yōu)化參數(shù)(搜索窗口大?。⑶也患俣〝?shù)據(jù)聚類的球形先驗形狀。

主成分分析 (PCA) 是一種數(shù)據(jù)降維技術(shù),它將一組可能相關(guān)的特征轉(zhuǎn)換為一組名為主成分的線性不相關(guān)變量。主成分按方差順序排列。第一個分量的變化最大;第二個在此之下有下一個變體,依此類推。

第三部分在功能安全要求的背景下評估這些機器學習算法。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8353

    瀏覽量

    132315
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5466

    瀏覽量

    120891
收藏 人收藏

    評論

    相關(guān)推薦

    激光雷達技術(shù)的基于深度學習的進步

    信息。這使得激光雷達在自動駕駛、無人機、機器人等領(lǐng)域具有廣泛的應用前景。 二、深度學習技術(shù)的發(fā)展 深度學習機器
    的頭像 發(fā)表于 10-27 10:57 ?257次閱讀

    機器技術(shù)的發(fā)展趨勢

    機器技術(shù)的發(fā)展趨勢呈現(xiàn)出多元化、智能化和廣泛應用的特點。 一、智能化與自主化 人工智能(AI)與機器學習 : AI和機器
    的頭像 發(fā)表于 10-25 09:27 ?365次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機器學習——讓算法從數(shù)據(jù)中學習。
    發(fā)表于 10-24 17:22 ?2423次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    DaVinci技術(shù)背景和規(guī)格

    電子發(fā)燒友網(wǎng)站提供《DaVinci技術(shù)背景和規(guī)格.pdf》資料免費下載
    發(fā)表于 10-09 09:29 ?0次下載
    DaVinci<b class='flag-5'>技術(shù)</b><b class='flag-5'>背景</b>和規(guī)格

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    。 時間序列的單調(diào)性理論是數(shù)學求導。下面是使用EWMA分析股票價格變動,以決定買入還是賣出。通過仿真數(shù)據(jù),這種指數(shù)移動平均的技術(shù)剔除了短期波動,有助看清股票整體趨勢。 通過對本章學習,對時間序列的研究目的、方法與特征有了較全
    發(fā)表于 08-17 21:12

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機器學習算法在時間序列預測中的應用,內(nèi)容全面,循序漸進。每一章都經(jīng)過精心設(shè)計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀
    發(fā)表于 08-12 11:28

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時
    發(fā)表于 08-11 17:55

    機器人視覺技術(shù)中圖像分割方法有哪些

    機器人視覺技術(shù)是人工智能領(lǐng)域的一個重要分支,它涉及到圖像處理、模式識別、機器學習等多個學科。圖像分割是機器人視覺
    的頭像 發(fā)表于 07-04 11:34 ?685次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?672次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術(shù)的進步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發(fā)表于 07-01 11:40 ?1101次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    和專業(yè)知識,對這一領(lǐng)域進行系統(tǒng)的梳理和總結(jié)。然而,將時間序列分析與機器學習技術(shù)相結(jié)合的書籍卻并不多見。 以上正是《時間序列與機器學習》這本“
    發(fā)表于 06-25 15:00

    深入探討機器學習的可視化技術(shù)

    機器學習可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學習模型、數(shù)據(jù)及其關(guān)系的過程。目標是使理解模型的復雜算法和數(shù)據(jù)模式更容易,使技術(shù)
    發(fā)表于 04-25 11:17 ?353次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視化<b class='flag-5'>技術(shù)</b>

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領(lǐng)域,涉及到多個行業(yè)和領(lǐng)域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關(guān)鍵是使用機器學習算法,這是一類基于樣本數(shù)據(jù)和模型訓練來進行預測和判斷的算法。下面將介紹使用
    的頭像 發(fā)表于 04-04 08:41 ?232次閱讀

    如何使用TensorFlow構(gòu)建機器學習模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創(chuàng)建一個簡單的機器學習模型。
    的頭像 發(fā)表于 01-08 09:25 ?895次閱讀
    如何使用TensorFlow構(gòu)建<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型

    機器視覺照明技術(shù)基礎(chǔ)知識概述

    機器視覺(machine vision)照明技術(shù)主要任務為提升被測物體特征與背景之間的對比度。
    的頭像 發(fā)表于 12-18 17:36 ?1155次閱讀
    <b class='flag-5'>機器</b>視覺照明<b class='flag-5'>技術(shù)</b>基礎(chǔ)知識概述