0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

線性判別分析LDA背后的數(shù)學(xué)原理

jf_78858299 ? 來源:人工智能大講堂 ? 作者:人工智能大講堂 ? 2023-04-19 11:30 ? 次閱讀

線性判別分析(LDA)是一種降維技術(shù),其目標(biāo)是將數(shù)據(jù)集投影到較低維度空間中。線性判別分析也被稱為正態(tài)判別分析(NDA)或判別函數(shù)分析,是Fisher線性判別的推廣。

線性判別分析(LDA)和主成分分析(PCA)都是常用的線性變換技術(shù),用于降低數(shù)據(jù)的維度。

PCA可以描述為“無監(jiān)督”算法,因?yàn)樗昂雎浴鳖悇e標(biāo)簽,其目標(biāo)是找到最大化數(shù)據(jù)集方差的方向(所謂的主成分)。

與PCA不同,LDA是“有監(jiān)督的”,它計(jì)算出能夠最大化多個(gè)類別之間間隔的軸(“線性判別”)。

圖片

LDA是如何工作的?

LDA使用Fisher線性判別方法來區(qū)分類別。

Fisher線性判別是一種分類方法,它將高維數(shù)據(jù)投影到一維空間中,并在這個(gè)一維空間中進(jìn)行分類。

投影最大化類別均值之間的距離,同時(shí)最小化每個(gè)類別內(nèi)部的方差。

圖片

類別:1、2和3

類別均值:μ1、μ2和μ3

類別間散布:SB1、SB2和SB3

類別內(nèi)散布:SW1、SW2和SW3

數(shù)據(jù)集均值:μ

它的思想是最大化類別間散布SB,同時(shí)最小化類別內(nèi)散布SW。

數(shù)學(xué)公式

圖片

圖片

動(dòng)機(jī)

  • 尋找一個(gè)方向,可以放大類間差異。

  • 最大化投影后的均值之間的(平方)差異。

    (通過找到最大化類別均值之間差異的方向,LDA可以有效地將數(shù)據(jù)投影到一個(gè)低維子空間中,其中類別更容易分離)

圖片

  • 最小化每個(gè)類別內(nèi)的投影散布

    (通過找到最大化類別均值之間差異的方向,LDA可以有效地將數(shù)據(jù)投影到一個(gè)低維子空間中,其中類別更容易分離)

    圖片

散布

圖片

圖片

均值差異

圖片

散布差異

圖片

Fischer 指數(shù)

圖片

圖片

這意味著在選擇特征值時(shí),我們將始終選擇C-1個(gè)特征值及其相應(yīng)的特征向量。其中,C為數(shù)據(jù)集中的類別數(shù)。

例子

**數(shù)據(jù)集

**

圖片

步驟1:計(jì)算類內(nèi)散布矩陣(SW)

圖片

計(jì)算每個(gè)類別的協(xié)方差矩陣

類別1:

圖片

Class 1

均值矩陣:

圖片

協(xié)方差:

圖片

圖片

圖片

將S1到 S5加在一起就得到了 Sc1

圖片

類別2:

圖片

Class 2

均值矩陣:

圖片

圖片

和 Sc1一樣, 將S6 到S10加到一起, 就得到了協(xié)方差 Sc2 -

圖片

將Sc1和Sc2相加就得到了類內(nèi)散布矩陣Sw。

圖片

步驟2:計(jì)算類間散布矩陣(SB)

圖片

我們已經(jīng)有了類別1和類別2每個(gè)特征的均值。

圖片

步驟3:找到最佳LDA投影向量

與PCA類似,我們使用具有最大特征值的特征向量來找到最佳投影向量。該特征向量可以用以下形式表示。

圖片

我們已經(jīng)計(jì)算得到了SB和SW。

圖片

解出lambda后,我們得到最高值lambda = 15.65?,F(xiàn)在,對于每個(gè)lambda值,解出相應(yīng)的向量。

圖片

圖片

圖片

步驟4:將樣本轉(zhuǎn)換到新子空間上。

圖片

因此,使用LDA我們進(jìn)行了如下轉(zhuǎn)換。

圖片

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4237

    瀏覽量

    61969
  • 線性
    +關(guān)注

    關(guān)注

    0

    文章

    194

    瀏覽量

    25080
  • LDA
    LDA
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    10574
收藏 人收藏

    評論

    相關(guān)推薦

    GraphSAGEGNN算法的數(shù)學(xué)原理是什么?

    本文深入討論了GraphSAGEGNN算法的數(shù)學(xué)原理,并從多個(gè)維度分析了GNN加速器設(shè)計(jì)中的技術(shù)挑戰(zhàn)。
    發(fā)表于 06-17 08:56

    變壓變頻調(diào)速的數(shù)學(xué)原理是什么

    變壓變頻調(diào)速系統(tǒng)的基本原則是什么?變壓變頻調(diào)速的數(shù)學(xué)原理是什么?
    發(fā)表于 08-03 06:10

    基于核函數(shù)的Fisher判別分析算法在人耳識(shí)別中的應(yīng)用

    針對人耳圖像自身的特點(diǎn),并通過對現(xiàn)有生物識(shí)別技術(shù)的研究,本文嘗試采用了一種基于核函數(shù)的Fisher 判別分析算法對人耳進(jìn)行識(shí)別。該算法不僅可以有效地提取人耳特征,獲得
    發(fā)表于 05-30 11:44 ?29次下載

    近鄰邊界Fisher判別分析

    將數(shù)據(jù)集進(jìn)行合理的維數(shù)約簡對于一些機(jī)器學(xué)習(xí)算法效率的提高起著至關(guān)重要的影響。該文提出了一種利用數(shù)據(jù)點(diǎn)鄰域信息的線性監(jiān)督降維算法:近鄰邊界Fisher 判別分析(Neighborhood Ma
    發(fā)表于 11-21 11:12 ?7次下載

    KPL特征提取在心電識(shí)別中的應(yīng)用研究

    本文結(jié)合核方法、主元分析(PCA)和線性判別分析(LDA)等機(jī)器學(xué)習(xí)方法,提出了一種特征提取的KPL 方法。本文提出的KPL 方法,能夠保持?jǐn)?shù)據(jù)集的非
    發(fā)表于 01-27 14:02 ?18次下載

    虛電壓的判別分析

    虛電壓的判別分析
    發(fā)表于 08-08 17:37 ?1595次閱讀
    虛電壓的<b class='flag-5'>判別分析</b>圖

    dq坐標(biāo)變換數(shù)學(xué)原理

    dq坐標(biāo)變換數(shù)學(xué)原理
    發(fā)表于 12-20 22:56 ?19次下載

    人臉識(shí)別經(jīng)典算法三:Fisherface(LDA

    斯坦福公開課機(jī)器學(xué)習(xí)或者補(bǔ)充線代等數(shù)學(xué)知識(shí)。 同時(shí)作者要感謝cnblogs上的大牛JerryLead,本篇博文基本摘自他的線性判別分析(Linear Discrimina
    發(fā)表于 12-04 20:30 ?1761次閱讀

    核局部Fisher判別分析的行人重識(shí)別

    ;在度量學(xué)習(xí)方面,傳統(tǒng)的核局部Fisher判別分析度量學(xué)習(xí)方法對所有查詢圖像統(tǒng)一映射到相同的特征空間中,忽略了查詢圖像不同區(qū)域的重要性,為此在核局部Fisher判別分析的基礎(chǔ)上對特征進(jìn)行區(qū)域分組,采用查詢自適應(yīng)得分融合方
    發(fā)表于 12-13 17:25 ?0次下載

    基于逐步判別分析的血液氣味識(shí)別

    本文以血液氣味色譜為基礎(chǔ),利用逐步判別分析法建立了血液氣味識(shí)別模型,并對血液氣味識(shí)別模型的建立進(jìn)行了詳細(xì)描述。以Matlab為計(jì)算工具,編寫了血液氣味識(shí)別模型的代碼。以人體血液與犬、雞的血液為例,討論了血液氣味識(shí)別模型的使用方法。血液氣味識(shí)別模型能夠正確區(qū)分人體血液與動(dòng)物血液。
    發(fā)表于 01-04 16:38 ?0次下載
    基于逐步<b class='flag-5'>判別分析</b>的血液氣味識(shí)別

    基于監(jiān)督局部線性嵌入的中藥材分類鑒別研究

    電子鼻所采集的中藥材氣味信息往往具有高維性和非線性。針對氣味信息的這種特性,提出一種基于監(jiān)督局部線性嵌入( SLLE)和線性判別分析LDA
    發(fā)表于 01-14 11:20 ?0次下載

    利用基于線性判別分析的多變量分析模型對豇豆種子進(jìn)行分類

    判別分析LDA)的多變量分析模型,根據(jù)種子的老化程度、活力程度、幼苗生長狀況和發(fā)芽速度將種子分為不同的類別。
    的頭像 發(fā)表于 03-29 15:11 ?2345次閱讀
    利用基于<b class='flag-5'>線性</b><b class='flag-5'>判別分析</b>的多變量<b class='flag-5'>分析</b>模型對豇豆種子進(jìn)行分類

    深入卷積神經(jīng)網(wǎng)絡(luò)背后數(shù)學(xué)原理

    在計(jì)算機(jī)神經(jīng)視覺技術(shù)的發(fā)展過程中,卷積神經(jīng)網(wǎng)絡(luò)成為了其中的重要組成部分,本文對卷積神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)原理進(jìn)行了介紹。
    的頭像 發(fā)表于 04-25 14:52 ?3471次閱讀

    十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

    先前呢,我們在最受歡迎的十大機(jī)器學(xué)習(xí)算法-part1和最受歡迎的十大機(jī)器學(xué)習(xí)算法-part2兩篇文章中簡單介紹了十種機(jī)器學(xué)習(xí)算法,有的讀者反映看完還是云里霧里,所以,我會(huì)挑幾種難理解的算法詳細(xì)講解一下,今天我們介紹的是線性判別分析。
    的頭像 發(fā)表于 02-03 07:28 ?7217次閱讀

    計(jì)算機(jī)代數(shù)系統(tǒng)數(shù)學(xué)原理

    本文主要討論計(jì)算機(jī)代數(shù)系統(tǒng)的數(shù)學(xué)原理,由十六個(gè)章節(jié)組成。內(nèi)容包含高精度運(yùn)算,數(shù)論,數(shù)學(xué)常數(shù),精確線性代數(shù),多項(xiàng)式,方程求解,符號(hào)求和,符號(hào)積分,微分方程符號(hào)解等九大部分,涵蓋了構(gòu)建計(jì)算機(jī)代數(shù)系統(tǒng)的最基礎(chǔ)也是最重要的內(nèi)容。許多內(nèi)容
    發(fā)表于 03-24 14:18 ?21次下載