0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

常見(jiàn)的幾種聚類(lèi)算法

倩倩 ? 來(lái)源:淮安海之聲旗艦店 ? 2020-04-15 15:23 ? 次閱讀

目前,聚類(lèi)算法被廣泛應(yīng)用于用戶畫(huà)像、廣告推薦、新聞推送和圖像分割等等。聚類(lèi)算法是機(jī)器學(xué)習(xí)中一種“數(shù)據(jù)探索”的分析方法,它幫助我們?cè)诖罅康臄?shù)據(jù)中探索和發(fā)現(xiàn)數(shù)據(jù)的結(jié)構(gòu)。那么機(jī)器學(xué)習(xí)中的聚類(lèi)算法有哪幾種呢?下面我將為大家一一介紹常見(jiàn)的幾種聚類(lèi)算法,分別是高斯聚類(lèi)模型、基于密度的聚類(lèi)算法、凝聚層次聚類(lèi)和均值漂移算法。

1、高斯聚類(lèi)模型

事實(shí)上,GMM 和 k-means 很像,不過(guò) GMM 是學(xué)習(xí)出一些概率密度函數(shù)來(lái),簡(jiǎn)單地說(shuō),k-means 的結(jié)果是每個(gè)數(shù)據(jù)點(diǎn)被 assign 到其中某一個(gè) cluster 了,而 GMM 則給出這些數(shù)據(jù)點(diǎn)被 assign 到每個(gè) cluster 的概率,又稱作 soft assignment 。

2、基于密度的聚類(lèi)算法

基于密度的聚類(lèi)算法最大的優(yōu)點(diǎn)在于無(wú)需定義類(lèi)的數(shù)量,其次可以識(shí)別出局外點(diǎn)和噪聲點(diǎn)、并且可以對(duì)任意形狀的數(shù)據(jù)進(jìn)行聚類(lèi)。DBSCAN同樣是基于密度的聚類(lèi)算法,但其原理卻與均值漂移大不相同:首先從沒(méi)有被遍歷的任一點(diǎn)開(kāi)始,利用鄰域距離epsilon來(lái)獲取周?chē)c(diǎn);如果鄰域內(nèi)點(diǎn)的數(shù)量滿足閾值則此點(diǎn)成為核心點(diǎn)并以此開(kāi)始新一類(lèi)的聚類(lèi);其鄰域內(nèi)的所有點(diǎn)也屬于同一類(lèi),將所有的鄰域內(nèi)點(diǎn)以epsilon為半徑進(jìn)行步驟二的計(jì)算;重復(fù)步驟二、三直到變量完所有核心點(diǎn)的鄰域點(diǎn);此類(lèi)聚類(lèi)完成,同時(shí)又以任意未遍歷點(diǎn)開(kāi)始步驟一到四直到所有數(shù)據(jù)點(diǎn)都被處理;最終每個(gè)數(shù)據(jù)點(diǎn)都有自己的歸屬類(lèi)別或者屬于噪聲。

3、K均值聚類(lèi)

這一最著名的聚類(lèi)算法主要基于數(shù)據(jù)點(diǎn)之間的均值和與聚類(lèi)中心的聚類(lèi)迭代而成。它主要的優(yōu)點(diǎn)是十分的高效,由于只需要計(jì)算數(shù)據(jù)點(diǎn)與劇類(lèi)中心的距離,其計(jì)算復(fù)雜度只有O(n)。其工作原理主要分為以下四步:首先我們需要預(yù)先給定聚類(lèi)的數(shù)目同時(shí)隨機(jī)初始化聚類(lèi)中心。我們可以初略的觀察數(shù)據(jù)并給出較為準(zhǔn)確的聚類(lèi)數(shù)目;每一個(gè)數(shù)據(jù)點(diǎn)通過(guò)計(jì)算與聚類(lèi)中心的距離了來(lái)分類(lèi)到最鄰近的一類(lèi)中;根據(jù)分類(lèi)結(jié)果,利用分類(lèi)后的數(shù)據(jù)點(diǎn)重新計(jì)算聚類(lèi)中心;重復(fù)步驟二三直到聚類(lèi)中心不再變化。

4、凝聚層次聚類(lèi)

層次聚類(lèi)法主要有自頂向下和自底向上兩種方式。其中自底向上的方式,最初將每個(gè)點(diǎn)看作是獨(dú)立的類(lèi)別,隨后通過(guò)一步步的凝聚最后形成獨(dú)立的一大類(lèi),并包含所有的數(shù)據(jù)點(diǎn)。這會(huì)形成一個(gè)樹(shù)形結(jié)構(gòu),并在這一過(guò)程中形成聚類(lèi)。

5、均值漂移算法

這是一種基于滑動(dòng)窗口的均值算法,用于尋找數(shù)據(jù)點(diǎn)中密度最大的區(qū)域。其目標(biāo)是找出每一個(gè)類(lèi)的中心點(diǎn),并通過(guò)計(jì)算滑窗內(nèi)點(diǎn)的均值更新滑窗的中心點(diǎn)。最終消除臨近重復(fù)值的影響并形成中心點(diǎn),找到其對(duì)應(yīng)的類(lèi)別。其工作原理主要是以下幾點(diǎn):首先以隨機(jī)選取的點(diǎn)為圓心r為半徑做一個(gè)圓形的滑窗。其目標(biāo)是找出數(shù)據(jù)點(diǎn)中密度最高點(diǎn)并作為中心;在每個(gè)迭代后滑動(dòng)窗口的中心將為想著較高密度的方向移動(dòng);連續(xù)移動(dòng),直到任何方向的移動(dòng)都不能增加滑窗中點(diǎn)的數(shù)量,此時(shí)滑窗收斂;將上述步驟在多個(gè)滑窗上進(jìn)行以覆蓋所有的點(diǎn)。當(dāng)過(guò)個(gè)滑窗收斂重疊時(shí),其經(jīng)過(guò)的點(diǎn)將會(huì)通過(guò)其滑窗聚類(lèi)為一個(gè)類(lèi)。

以上就是機(jī)器學(xué)習(xí)中常見(jiàn)的五種聚類(lèi)算法,大家都了解了嗎?如果還想深入學(xué)習(xí)聚類(lèi)算法的相關(guān)內(nèi)容,比如原理、算法效果的衡量標(biāo)準(zhǔn)以及基于Kmeans算法進(jìn)行改進(jìn)的優(yōu)化方法,可以上博學(xué)谷官網(wǎng)進(jìn)行有關(guān)課程的在線學(xué)習(xí)。希望大家通過(guò)課程可以學(xué)會(huì)使用聚類(lèi)算法進(jìn)行數(shù)據(jù)分析,挖掘商業(yè)價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4587

    瀏覽量

    92501
  • 聚類(lèi)
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14199
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132312
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    幾種常見(jiàn)的控制方法及其優(yōu)缺點(diǎn)

    。 溫度控制系統(tǒng)是變參數(shù)、有時(shí)滯和隨機(jī)干擾的動(dòng)態(tài)系統(tǒng),為達(dá)到滿意的控制效果,具有許多控制方法。故對(duì)幾種常見(jiàn)的控制方法及其優(yōu)缺點(diǎn)進(jìn)行了分析與比較。
    的頭像 發(fā)表于 11-09 09:57 ?140次閱讀
    <b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的控制方法及其優(yōu)缺點(diǎn)

    人員軌跡分析算法有哪些?

    時(shí)段等。這些信息可以對(duì)城市規(guī)劃、交通管理、公共安全等方面具有重要的指導(dǎo)意義。而為了實(shí)現(xiàn)人員軌跡分析,我們需要使用一些專(zhuān)門(mén)的算法和技術(shù)。 下面是幾種常用的人員軌跡分析算法: 1. 基于密度的
    的頭像 發(fā)表于 09-26 10:42 ?252次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)算法原理,包括線性回歸、邏輯回歸、支持向量機(jī)(SVM)、決策樹(shù)和K近鄰(KNN)
    的頭像 發(fā)表于 07-02 11:25 ?669次閱讀

    功率放大器的幾種常見(jiàn)類(lèi)型

    功率放大器,簡(jiǎn)稱功放,是音響系統(tǒng)中的重要組成部分,其主要作用是將音頻信號(hào)放大,以驅(qū)動(dòng)揚(yáng)聲器發(fā)出更大的聲音。在音頻領(lǐng)域,功率放大器的種類(lèi)繁多,各具特色。本文將對(duì)功率放大器的幾種常見(jiàn)類(lèi)型進(jìn)行詳細(xì)介紹
    的頭像 發(fā)表于 05-23 16:03 ?2254次閱讀

    STM32單片機(jī)有哪幾種常見(jiàn)的開(kāi)發(fā)環(huán)境?

    STM32單片機(jī)是一款廣泛應(yīng)用于嵌入式系統(tǒng)開(kāi)發(fā)的單片機(jī),針對(duì)其開(kāi)發(fā),有以下幾種常見(jiàn)的方式:STM32單片機(jī)有哪幾種常見(jiàn)的開(kāi)發(fā)環(huán)境?KeilMDK是一款廣泛使用的單片機(jī)集成開(kāi)發(fā)環(huán)境,支持
    的頭像 發(fā)表于 05-18 08:04 ?2784次閱讀
    STM32單片機(jī)有哪<b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的開(kāi)發(fā)環(huán)境?

    介紹幾種常見(jiàn)的e-PTFE防水透氣膜型號(hào)和規(guī)格

    大家好,我是微爾斯科技的VILI專(zhuān)注于高分子微孔材料的研發(fā)、應(yīng)用與推廣e-PTFE防水透氣膜是一種廣泛應(yīng)用于各種領(lǐng)域的高分子微孔材料,其型號(hào)和規(guī)格繁多,各具特色。下面,我們將詳細(xì)介紹幾種常見(jiàn)
    的頭像 發(fā)表于 05-07 08:08 ?768次閱讀
    介紹<b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的e-PTFE防水透氣膜型號(hào)和規(guī)格

    基于FPGA的常見(jiàn)的圖像算法模塊總結(jié)

    意在給大家補(bǔ)充一下基于FPGA的圖像算法基礎(chǔ),于是講解了一下常見(jiàn)的圖像算法模塊,經(jīng)過(guò)個(gè)人的總結(jié),將知識(shí)點(diǎn)分布如下所示。
    的頭像 發(fā)表于 04-28 11:45 ?514次閱讀
    基于FPGA的<b class='flag-5'>常見(jiàn)</b>的圖像<b class='flag-5'>算法</b>模塊總結(jié)

    java實(shí)現(xiàn)多線程的幾種方式

    了多種實(shí)現(xiàn)多線程的方式,本文將詳細(xì)介紹以下幾種方式: 1.繼承Thread類(lèi) 2.實(shí)現(xiàn)Runnable接口 3.Callable和Future 4.線程池 5.Java 8中
    的頭像 發(fā)表于 03-14 16:55 ?550次閱讀

    浪涌保護(hù)器常見(jiàn)幾種抑制器件特點(diǎn)及應(yīng)用領(lǐng)域

    浪涌保護(hù)器常見(jiàn)幾種抑制器件特點(diǎn)及應(yīng)用領(lǐng)域? 浪涌保護(hù)器是一種用于保護(hù)電器設(shè)備免受過(guò)電壓和過(guò)電流的損害的裝置。而抑制器件是浪涌保護(hù)器的重要組成部分,用于抑制電壓和電流的浪涌。 下面將詳細(xì)介紹幾種
    的頭像 發(fā)表于 02-19 09:25 ?818次閱讀

    光耦失效的幾種常見(jiàn)問(wèn)題解析

    光耦失效的幾種常見(jiàn)問(wèn)題解析? 光耦失效是一個(gè)常見(jiàn)的問(wèn)題,特別是在電子設(shè)備中經(jīng)常使用光耦進(jìn)行隔離和信號(hào)傳輸?shù)那闆r下。下面將詳細(xì)介紹一些光耦失效的常見(jiàn)問(wèn)題以及解析。 1. 輸出信號(hào)弱或無(wú)輸
    的頭像 發(fā)表于 12-25 14:30 ?5797次閱讀

    運(yùn)行Python程序的幾種常見(jiàn)方法

    Python是一種高級(jí)編程語(yǔ)言,具有簡(jiǎn)單易學(xué),易于閱讀和調(diào)試的特點(diǎn)。當(dāng)你完成了一個(gè)Python程序之后,你需要運(yùn)行它以檢查程序是否按照預(yù)期工作。下面是運(yùn)行Python程序的幾種常見(jiàn)
    的頭像 發(fā)表于 11-28 15:32 ?2320次閱讀

    LED顯示屏常見(jiàn)幾種控制解決方案

    常見(jiàn)幾種操作解決方案:3G/4G解決方案、Wi-Fi解決方案、同異步雙??刂品桨浮⒍嗥廉?huà)面同步方案、LED局域網(wǎng)控制方案五大類(lèi),當(dāng)然也可以根據(jù)用戶的實(shí)際要求定制方案。
    的頭像 發(fā)表于 11-23 12:00 ?6429次閱讀
    LED顯示屏<b class='flag-5'>常見(jiàn)</b><b class='flag-5'>幾種</b>控制解決方案

    光耦失效的幾種常見(jiàn)原因及分析

    光耦失效的幾種常見(jiàn)原因及分析? 光耦是一種光電耦合器件,由發(fā)光二極管和光探測(cè)器組成。它能夠?qū)㈦娏餍盘?hào)轉(zhuǎn)換為光信號(hào),或者將光信號(hào)轉(zhuǎn)換為電流信號(hào)。但是,由于各種原因,光耦可能會(huì)出現(xiàn)失效的情況。本文將
    的頭像 發(fā)表于 11-20 15:13 ?4142次閱讀

    EPS消防應(yīng)急電源常見(jiàn)類(lèi)質(zhì)量問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《EPS消防應(yīng)急電源常見(jiàn)類(lèi)質(zhì)量問(wèn)題.pdf》資料免費(fèi)下載
    發(fā)表于 11-14 10:11 ?0次下載
    EPS消防應(yīng)急電源<b class='flag-5'>常見(jiàn)</b>三<b class='flag-5'>類(lèi)</b>質(zhì)量問(wèn)題

    幾種常見(jiàn)的設(shè)計(jì)模式實(shí)現(xiàn)

    1.單例模式 作用:保證一個(gè)類(lèi)只有一個(gè)實(shí)例,并提供一個(gè)訪問(wèn)它的全局訪問(wèn)點(diǎn),使得系統(tǒng)中只有唯一的一個(gè)對(duì)象實(shí)例。 應(yīng)用:常用于管理資源,如日志、線程池 實(shí)現(xiàn)要點(diǎn): 在類(lèi)中,要構(gòu)造一個(gè)實(shí)例,就必須調(diào)用類(lèi)
    的頭像 發(fā)表于 11-13 14:25 ?493次閱讀
    <b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的設(shè)計(jì)模式實(shí)現(xiàn)