0),由上節(jié)定義可知,幾何間隔是點(diǎn)到超平面最短的距離,如下圖的紅色直線:" />
0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

支持向量機(jī)的分類思想

lviY_AI_shequ ? 來(lái)源:未知 ? 作者:李倩 ? 2018-11-23 08:58 ? 次閱讀

前言

支持向量機(jī)是一種經(jīng)典的機(jī)器學(xué)習(xí)算法,在小樣本數(shù)據(jù)集的情況下有非常廣的應(yīng)用,我覺得,不懂支持向量機(jī)不算是入門機(jī)器學(xué)習(xí)。本篇循序漸進(jìn)的講解了支持向量機(jī)的分類思想,希望對(duì)您有幫助。

目錄

1. 函數(shù)間隔和幾何間隔

2. 支持向量機(jī)的分類思想

3. 總結(jié)

1. 函數(shù)間隔和幾何間隔

為了能夠更好的闡述支持向量機(jī)的分類思想,需要理解函數(shù)間隔和幾何間隔的定義。

1. 點(diǎn)到超平面的距離

假設(shè)超平面方程:

點(diǎn)到平面的距離:

由上式可得:沒有分類信息,而函數(shù)間隔和幾何間隔不僅包含了距離信息,還包含了分類信息。

2. 函數(shù)間隔和幾何間隔

對(duì)于給定的訓(xùn)練數(shù)據(jù)集T,正樣本和負(fù)樣本分別為+1和-1,我們對(duì)式(1.1)稍微進(jìn)行了修改:

(1). 點(diǎn)到平面的距離不作規(guī)范化處理,得:

(2). 去掉絕對(duì)值符號(hào),并乘以標(biāo)記結(jié)果y0,得:

d2表達(dá)式就是函數(shù)間隔的定義,有兩層含義:大小表示點(diǎn)P0到超平面的距離,正負(fù)表示點(diǎn)P0是否正確分類,若d<0,分類錯(cuò)誤;反之,則分類正確。

因此,我們定義點(diǎn)到超平面的函數(shù)間隔為:

接著定義訓(xùn)練數(shù)據(jù)集T的函數(shù)間隔是所有樣本點(diǎn)(xi,yi)的函數(shù)間隔的最小值,即:

其中,

但是,若成比例的增加超平面參數(shù)w和b,超平面沒有改變,但是函數(shù)間隔卻成比例的增加了,這是不符合理論的,因此,需要對(duì)函數(shù)間隔進(jìn)行規(guī)范化,得:

(1.7)式就是幾何間隔的定義,幾何間隔的值是確定的。

2. 支持向量機(jī)的分類思想

1. 感知機(jī)和logistic回歸的分類思想

感知機(jī)的損失函數(shù)為所有誤分類點(diǎn)到超平面的距離之和:

無(wú)誤分類點(diǎn)時(shí),損失函數(shù)為0,滿足模型分類條件的超平面有無(wú)數(shù)個(gè),如下圖:

初始超平面為l1,誤分類點(diǎn)為紅色框,最小化式(2.1)有無(wú)窮多個(gè)滿足損失函數(shù)為0的超平面,如上圖的l2~ln,然而,最佳分類超平面只有一個(gè),即支持向量機(jī)所對(duì)應(yīng)的超平面。

假設(shè)logistic回歸的模型是,logistic回歸的損失函數(shù):

簡(jiǎn)單分析(2.2)式的分類思想:

(1).當(dāng)yi=1時(shí),損失函數(shù)簡(jiǎn)化為:

若要使損失函數(shù)越小越好,則xi的值越大越好,如下圖:

圖2.1

當(dāng)往箭頭方向移動(dòng)時(shí),損失函數(shù)逐漸變小。

(2). 當(dāng)yi=0時(shí),損失函數(shù)簡(jiǎn)化為:

若要使損失函數(shù)越小越好,則xi的值越小越好,如下圖:

當(dāng)往箭頭方向移動(dòng)時(shí),損失函數(shù)逐漸變小。

2. 支持向量機(jī)的分類思想

支持向量機(jī)結(jié)合了感知機(jī)和logistic回歸分類思想,假設(shè)訓(xùn)練樣本點(diǎn)(xi,yi)到超平面H的幾何間隔為γ(γ>0),由上節(jié)定義可知,幾何間隔是點(diǎn)到超平面最短的距離,如下圖的紅色直線:

用logisitic回歸模型分析幾何間隔:

因此,當(dāng)γ越大時(shí),損失函數(shù)越小,結(jié)果為正樣本的概率也越大。

因此,感知機(jī)的分類思想是最大化點(diǎn)到超平面的幾何間隔,這個(gè)問題可以表示為下面的約束最優(yōu)化問題:

根據(jù)幾何間隔和函數(shù)間隔的關(guān)系,得幾何間隔的約束最優(yōu)化問題:

函數(shù)間隔是樣本點(diǎn)到超平面的最短距離,因此,令函數(shù)間隔為常數(shù)1,那么其他樣本點(diǎn)到超平面的距離都大于1,且最大化和最小化是等價(jià)的。于是就得到下面的最優(yōu)化問題:

由(2.8)式和(2.9)式,解得最優(yōu)解w*,b*,易知最優(yōu)超平面到正負(fù)樣本的幾何間隔相等(請(qǐng)理解幾何間隔的含義,然后仔細(xì)回想整個(gè)分類過程,就會(huì)得到這個(gè)結(jié)論)。

3. 總結(jié)

本文結(jié)合了感知機(jī)和logistic回歸的分類思想來(lái)推導(dǎo)支持向量機(jī)的最優(yōu)化問題,即最大間隔分離超平面。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4277

    瀏覽量

    62323
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132312

原文標(biāo)題:支持向量機(jī)(一):支持向量機(jī)的分類思想

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于支持向量機(jī)分類問題

    小菜鳥一枚 ,有哪位大神能提供部分基于支持向量積的分類鑒別問題的MATLAB編碼,思路過程,不勝感激
    發(fā)表于 04-03 18:54

    如何用支持向量機(jī)分類器識(shí)別手寫字體

    sklearn實(shí)例-用支持向量機(jī)分類器(SVC)識(shí)別手寫字體
    發(fā)表于 06-11 17:02

    基于概率投票策略的多類支持向量機(jī)及應(yīng)用

    傳統(tǒng)的支持向量機(jī)是基于兩類問題提出的,如何將其有效地推廣至多類分類仍是一個(gè)研究的熱點(diǎn)問題。在分析比較現(xiàn)有支持
    發(fā)表于 04-01 08:53 ?12次下載

    改進(jìn)的支持向量機(jī)特征選擇算法

    針對(duì)采用支持向量機(jī)進(jìn)行分類的特征子集選擇問題,提出一種改進(jìn)的基于梯度向量的特征評(píng)測(cè)算法。該算法在核特征空間中,利用數(shù)據(jù)點(diǎn)到
    發(fā)表于 04-03 08:38 ?19次下載

    基于多分類支持向量機(jī)的隱寫域盲檢測(cè)

    提出一種區(qū)分隱寫域(包括像素域、DCT域、DWT域)的盲檢測(cè)方法,構(gòu)造圖像特征向量,建立一個(gè)多分類支持向量機(jī),根據(jù)特征
    發(fā)表于 04-20 09:32 ?14次下載

    特征加權(quán)支持向量機(jī)

    該文針對(duì)現(xiàn)有的加權(quán)支持向量機(jī)(WSVM)和模糊支持向量機(jī)(FSVM)只考慮樣本重要性而沒有考慮特
    發(fā)表于 11-21 11:15 ?15次下載

    基于改進(jìn)支持向量機(jī)的貨幣識(shí)別研究

    首先,預(yù)抽取支持向量以減少訓(xùn)練樣本數(shù)量,大大縮減訓(xùn)練時(shí)間;然后,用縮減后的樣本對(duì)改進(jìn)后的分類支持向量機(jī)
    發(fā)表于 12-14 14:57 ?14次下載

    基于形態(tài)小波范數(shù)熵和支持向量機(jī)的電能質(zhì)量分類研究

    基于形態(tài)小波范數(shù)熵和支持向量機(jī)的電能質(zhì)量分類研究_李夢(mèng)詩(shī)
    發(fā)表于 01-07 18:21 ?0次下載

    大樣本支持向量機(jī)分類策略研究_胡紅宇

    大樣本支持向量機(jī)分類策略研究_胡紅宇
    發(fā)表于 03-19 11:28 ?0次下載

    分類孿生支持向量機(jī)研究進(jìn)展

    孿生支持向量機(jī)因其簡(jiǎn)單的模型、快速的訓(xùn)練速度和優(yōu)秀的性能而受到廣泛關(guān)注.該算法最初是為解決二分類問題而提出的。不能直接用于解決現(xiàn)實(shí)生活中普遍存在的多
    發(fā)表于 12-19 11:32 ?0次下載

    多核學(xué)習(xí)支持向量機(jī)應(yīng)用音樂流派自動(dòng)分類

    針對(duì)不同特征向量下選擇最優(yōu)核函數(shù)的學(xué)習(xí)方法問題,將多核學(xué)習(xí)支持向量機(jī)( MK-SVM)應(yīng)用于音樂流派自動(dòng)分類中,提出了將最優(yōu)核函數(shù)進(jìn)行加權(quán)組
    發(fā)表于 01-09 15:25 ?2次下載
    多核學(xué)習(xí)<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>應(yīng)用音樂流派自動(dòng)<b class='flag-5'>分類</b>

    如何從零推導(dǎo)支持向量機(jī)

    支持向量機(jī) (SVM) 是一個(gè)非常經(jīng)典且高效的分類模型。 但是, 支持向量
    發(fā)表于 06-10 08:00 ?1次下載
    如何從零推導(dǎo)<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>

    OpenCV機(jī)器學(xué)習(xí)SVM支持向量機(jī)分類程序免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是OpenCV機(jī)器學(xué)習(xí)SVM支持向量機(jī)分類程序免費(fèi)下載。
    發(fā)表于 10-09 11:45 ?5次下載

    什么是支持向量機(jī) 什么是支持向量

    支持向量機(jī),英文為Support Vector Machine,簡(jiǎn)稱SV機(jī)(論文中一般簡(jiǎn)稱SVM)。它是一 種監(jiān)督式學(xué)習(xí)的方法,它廣泛的應(yīng)用于統(tǒng)計(jì)
    發(fā)表于 01-28 16:01 ?2.2w次閱讀
    什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b> 什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>

    支持向量機(jī)尋找最優(yōu)分類超平面的優(yōu)化問題

    根據(jù),在線性可分情況下,支持向量機(jī)尋找最優(yōu)分類超平面的優(yōu)化問題
    的頭像 發(fā)表于 05-11 11:13 ?1434次閱讀
    <b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>尋找最優(yōu)<b class='flag-5'>分類</b>超平面的優(yōu)化問題