有許多聚類算法可供選擇,對于所有情況,沒有單一的最佳聚類算法。相反,最好探索一系列聚類算法以及每種算法的不同配置。在本教程中,你將發(fā)現如何在 python 中安裝和使用頂級聚類算法。
2023-05-22 09:13:55171 分享一篇關于聚類的文章:10種聚類算法和Python代碼。
2023-01-07 09:33:38566 在聚類技術領域中,K-means可能是最常見和經常使用的技術之一。K-means使用迭代細化方法,基于用戶定義的集群數量(由變量K表示)和數據集來產生其最終聚類。例如,如果將K設置為3,則數據集將分組為3個群集,如果將K設置為4,則將數據分組為4個群集,依此類推。
2022-10-28 14:25:21499 K-means 算法是典型的基于距離的聚類算法,采用距離作為相似性的評價指標,兩個對象的距離越近,其相似度就越大。而簇是由距離靠近的對象組成的,因此算法目的是得到緊湊并且獨立的簇。
2022-07-18 09:19:131438 K-means 是一種聚類算法,且對于數據科學家而言,是簡單且熱門的無監(jiān)督式機器學習(ML)算法之一。
2022-06-06 11:53:552540 FCM聚類算法以及改進模糊聚類算法用于醫(yī)學圖像分割的matlab源程序
2018-05-11 23:30:42
基于模糊C均值聚類的軟件多缺陷定位方法
2021-06-02 14:38:416 為構建行駛工況,消除K均值算法對初始聚類中心的敏感性及噪聲點的干擾,提岀一種改進主成分分析和基于密度的改進k-均值聚類組合方法。結合距離優(yōu)化法和密度法,構建一種數據集密度度量方法。選取距離較大、密度
2021-05-31 11:16:083 簇控制在最優(yōu)傳輸距離內,實現簇內節(jié)點的能耗均衡。通過目標函數對K- means聚類簇進行優(yōu)化,保證簇內節(jié)點數目的均勻分布,并在考慮剩余能量和地理位置的基礎上完成節(jié)點數據傳輸。實驗結果表明,該算法在均衡網絡能耗的同時,可有效延長網絡生命
2021-05-26 14:50:172 針對含有噪聲的高維數據的聚類問題,提岀一種使用新的距離度量方式的増量式聚類算法 ANFCM(cp)。由于傳統(tǒng)的模糊C均值聚類算法對初始化聚類中心比較敏感,所提岀的聚類算法將單程FCM的増量機制(稱為
2021-05-12 15:20:511 為了降低K- mediods聚類算法的誤差并提高并行優(yōu)化的性能,將混合蛙跳算法運用于聚類和并行優(yōu)化過程。在Kmediods聚類過程中,將K- mediods與聚類簇思想相結合,對各個聚類簇進行混合
2021-05-08 16:17:184 為構建行駛工況,消除K-均值算法對初始聚類中心的敏感性及噪聲點的干擾,提岀一種改進主成分分析和基于密度的改進K-均值聚類組合方法。結合距離優(yōu)化法和密度法,構建一種數據集密度度量方法。選取距離較大
2021-04-16 15:36:0016 除邊界點和噪聲點對聚類結果的影響。引入關聯度矩陣,通過計算類簇間的關聯程度和融合度量,選取最優(yōu)關聯簇進行融合得到最終聚類結果。實驗結果表明,該算法無需人工設置聚類參數,并且與基于密度的空間聚類算法和K均值聚類算法
2021-04-01 16:16:4913 子空間并定義合理的約東函數指導聚類過程,從而實現類簇的可重疊性與離群點的控制。在此基礎上定義合理的目標函數對傳統(tǒng)K- Means算法進行修正,利用熵權約東分別計算每個類簇中各維度的權重,使用權重值標識不同類簇中維度的相對重要性,
2021-03-25 14:07:1013 度推薦算法。采用改進的蜂群算法來優(yōu)化K- means++聚類的中心點,使聚類中心在整個數據內達到最優(yōu),并對聚類結果進行集成,使得聚類得到進一步優(yōu)化。根據聚類結果,在同一類中采用改進的用戶相似度算法來優(yōu)化傳統(tǒng)相似度算法,
2021-03-18 11:17:1110 聚類或聚類分析是無監(jiān)督學習問題。它通常被用作數據分析技術,用于發(fā)現數據中的有趣模式,例如基于其行為的客戶群。有許多聚類算法可供選擇,對于所有情況,沒有單一的最佳聚類算法。相反,最好探索一系列聚類算法
2021-03-12 18:23:431828 幾張GIF理解K-均值聚類原理k均值聚類數學推導與python實現前文說了k均值聚類,他是基于中心的聚類方法,通過迭代將樣本分到k個類中,使...
2020-12-10 21:56:09216 這一最著名的聚類算法主要基于數據點之間的均值和與聚類中心的聚類迭代而成。它主要的優(yōu)點是十分的高效,由于只需要計算數據點與劇類中心的距離,其計算復雜度只有O(n)。
2020-04-15 15:23:2914904 聚類算法十分容易上手,但是選擇恰當的聚類算法并不是一件容易的事。
2020-03-15 17:10:001663 聚類分析是將研究對象分為相對同質的群組的統(tǒng)計分析技術,聚類分析的核心就是發(fā)現有用的對象簇。K-means聚類算法由于具有出色的速度和良好的可擴展性,一直備受廣大學者的關注。然而,傳統(tǒng)的K
2018-12-20 10:28:2910 中,干擾樣本個體之間的權重值,實現樣本個體間的信息隱藏以達到隱私保護的目的。通過UCI數據集上的仿真實驗,表明該算法能夠在一定的信息損失度范圍內實現有效的數據聚類,也可以對聚類數據進行保護。
2018-12-14 10:54:2610 K-means算法是被廣泛使用的一種聚類算法,傳統(tǒng)的-means算法中初始聚類中心的選擇具有隨機性,易使算法陷入局部最優(yōu),聚類結果不穩(wěn)定。針對此問題,引入多維網格空間的思想,首先將樣本集映射到一個
2018-12-13 17:56:551 針對傳統(tǒng)K-means型算法的“均勻效應”問題,提出一種基于概率模型的聚類算法。首先,提出一個描述非均勻數據簇的高斯混合分布模型,該模型允許數據集中同時包含密度和大小存在差異的簇;其次,推導了非均勻
2018-12-13 10:57:5910 )2個步驟,以提高平衡聚類算法的聚類效果與時間性能。首先基于模擬退火在數據集中快速定位出K個合適的數據點作為平衡聚類初始點,然后每個中心點分階段貪婪地將距離其最近的數據點加入簇中直至達到簇規(guī)模上限。在6個UCI真實數據集與2個公開圖
2018-11-28 09:53:067 無監(jiān)督學習是機器學習技術中的一類,用于發(fā)現數據中的模式。本文介紹用Python進行無監(jiān)督學習的幾種聚類算法,包括K-Means聚類、分層聚類、t-SNE聚類、DBSCAN聚類等。
2018-05-27 09:59:1329359 Matlab 提供系列函數用于聚類分析,歸納起來具體方法有如下: 方法一:直接聚類,利用 clusterdata 函數對樣本數據進行一次聚類,其缺點為可供用戶選擇的面較窄,不能更改距離的計算方法,該方法的使用者無需了解聚類的原理和過程,但是聚類效果受限制。
2018-05-18 15:04:006775 本文開始介紹了聚類算法概念,其次闡述了聚類算法的分類,最后詳細介紹了聚類算法中密度DBSCAN的相關概況。
2018-04-26 10:56:4121028 與分類不同,分類是示例式學習,要求分類前明確各個類別,并斷言每個元素映射到一個類別,而聚類是觀察式學習,在聚類前可以不知道類別甚至不給定類別數量,是無監(jiān)督學習的一種。目前聚類廣泛應用于統(tǒng)計學、生物學、數據庫技術和市場營銷等領域,相應的算法也非常的多。
2018-02-12 16:42:3514535 的規(guī)范化互信息(NMI);然后基于NMI的值來選擇用于聚類集成的K均值基聚類器的K值序列;最后采用二次互信息( QMI)的一致函數生成一致聚類結果,并使用一種半監(jiān)督方法對聚類簇進行標注。通過實驗比較了聚類集成方法與單個聚類算法
2018-02-09 10:35:560 針對譜聚類算法在解決高維、大數據量的聚類問題時出現的效率不高和準確率明顯下降的問題進行了研究,并在此研究基礎上結合最優(yōu)投影理論和Nystrom抽樣提出了基于最優(yōu)投影的半監(jiān)督譜聚類算法
2018-01-14 11:54:580 通過對基于K-means聚類的缺失值填充算法的改進,文中提出了基于距離最大化和缺失數據聚類的填充算法。首先,針對原填充算法需要提前輸入聚類個數這一缺點,設計了改進的K-means聚類算法:使用數據間
2018-01-09 10:56:560 提出基于可能性二均值聚類(Possibilistic Two Means, P2M)的二分類支持向量機(Support Vector Machine,SVM)。該算法先用P2M對未知類別的二分類數據
2018-01-09 10:45:010 基于SVM和模糊K均值算法的部位外觀模型。部位外觀模型由兩個分類器構成,線性SVM分類器用于判斷部位定位狀態(tài)是否屬于人體部位,相似度分類器由部位定位狀態(tài)與利用模糊K均值算法確定的部位聚類中心的歸一化歐氏距離來構造,用于計算
2018-01-08 15:13:400 在目標域可利用數據匱乏的場景下,傳統(tǒng)聚類算法的性能往往會下降,在該場景下,通過抽取源域中的有用知識用于指導目標域學習以得到更為合適的類別信息和聚類性能,是一種有效的學習策略.借此提出一種基于近鄰傳播
2018-01-07 09:34:440 基于相似度的聚類算法,該算法結合區(qū)間值模糊軟集的特性,著重對給出評價對象的具有相似知識水平的專家進行聚類,同時討論了算法的計算復雜度。最后通過實例說明該算法能有效地處理專家聚類問題。
2018-01-05 16:15:270 針對傳統(tǒng)模糊C一均值( FCM)聚類算法初始聚類中心不確定,且需要人為預先設定聚類類別數,從而導致結果不準確的問題,提出了一種基于中點密度函數的模糊聚類算法。首先,結合逐步回歸思想作為初始聚類中心
2017-12-26 15:54:200 針對大數據環(huán)境下K-means聚類算法聚類精度不足和收斂速度慢的問題,提出一種基于優(yōu)化抽樣聚類的K-means算法(OSCK)。首先,該算法從海量數據中概率抽樣多個樣本;其次,基于最佳聚類中心的歐氏
2017-12-22 15:47:180 研究加速K-medoids聚類算法,首先以PAM(partitiomng around medoids)、TPAM(triangular inequality elimination
2017-12-22 15:35:470 聚類作為無監(jiān)督學習技術,已在實際中得到了廣泛的應用,但是對于帶有噪聲的數據集,一些主流算法仍然存在著噪聲去除不徹底和聚類結果不準確等問題.本文提出了一種基于密度差分的自動聚類算法(CDD
2017-12-18 11:16:570 傳統(tǒng)的核聚類僅考慮了類內元素的關系而忽略了類間的關系,對邊界模糊或邊界存在噪聲點的數據集進行聚類分析時,會造成邊界點的誤分問題。為解決上述問題,在核模糊C均值( KFCM)聚類算法的基礎上提出了一種
2017-12-15 10:52:531 針對原始K-means聚類算法受初始聚類中心影響過大以及容易陷入局部最優(yōu)的不足,提出一種基于改進布谷鳥搜索(cs)的K-means聚類算法(ACS-K-means)。其中,自適應CS( ACS)算法
2017-12-13 17:24:063 方法進行改進,將傳統(tǒng)譜聚類算法(NJW-SC)中的基于歐氏距離的相似性測度換為基于流行距離的相似性測度,在此基礎上對樣本對象集進行聚類。之后將新提出來的算法同K-Means算法、傳統(tǒng)譜聚類算法、模糊C均值聚類算法在人工數據集
2017-12-07 14:53:033 的算法。首先,通過各向異性擴散處理圖像;然后,使用一維K-均值對像素進行聚類;最后,根據聚類結果和先驗知識將像素值修改為最佳類中心像素值。理論分析表明該算法可以使圖像的峰值信噪比( PSNR)達到最大值。實驗結果表明:所
2017-12-06 16:44:110 針對軌跡聚類算法在相似性度量中多以空間特征為度量標準,缺少對時間特征的度量,提出了一種基于時空模式的軌跡數據聚類算法。該算法以劃分再聚類框架為基礎,首先利用曲線邊緣檢測方法提取軌跡特征點;然后根據
2017-12-05 14:07:580 D-Stream作出并行化改進,用通用的大數據處理框架Spark設計了一個基于分布式架構運行的動態(tài)數據聚類算法PDStream。實驗結果表明,該算法具有更高的效率和良好的擴展性,能夠實現分布式架構下的流數據動態(tài)聚類。
2017-12-04 09:22:510 運用社會力模型( SFM)模擬人群疏散之前,需要先對人群進行聚類分組;然而,五中心聚類(k-medoids)和統(tǒng)計信息網格聚類( STING)這兩大傳統(tǒng)聚類算法,在聚類效率和準確率上都不能滿足要求
2017-12-03 10:53:040 盡可能歸于一類,而把不相似的樣本劃分到不同的類中。硬聚類把每個待識別的對象嚴格的劃分某類中,具有非此即彼的性質,而模糊聚類建立了樣本對類別的不確定描述,更能客觀的反應客觀世界,從而成為聚類分析的主流。
2017-12-01 14:26:0248589 模糊C均值聚類算法在數據挖掘領域有著廣泛的使用背景,而對初始點的敏感和較差的搜索能力,限制了算法的進一步推廣應用。人工蜂群算法具有對初始點不敏感、適應能力強和搜索能力強等優(yōu)點,并且針對人工蜂群算法
2017-11-29 17:22:210 針對傳統(tǒng)圖轉導( GT)算法計算量大并且準確率不高的問題,提出一個基于C均值聚類和圖轉導的半監(jiān)督分類算法。首先,采用模糊C均值(FCM)聚類算法先對未標記樣本預選取,縮小圖轉導算法構圖數據集的范圍
2017-11-28 16:36:120 針對核模糊C均值( KFCM)算法對初始聚類中心敏感、易陷入局部最優(yōu)的問題,利用人工蜂群(ABC)算法的構架簡單、全局收斂速度快的優(yōu)勢,提出了一種改進的人工蜂群算法( IABC)與KFCM迭代相結合
2017-11-28 16:14:040 針對傳統(tǒng)的K-means算法無法預先明確聚類數目,對初始聚類中心選取敏感且易受離群孤點影響導致聚類結果穩(wěn)定性和準確性欠佳的問題,提出一種改進的基于密度的K-means算法。該算法首先基于軌跡數據分布
2017-11-25 11:35:380 針對套用傳統(tǒng)的聚類方法對數據流的聚類是行不通的這一問題,提出一種以遺傳模擬退火算法為基礎的模糊C均值聚類算法(SACA_FCM)對數據流進行聚類。SACAFCM算法有效地避免了傳統(tǒng)的模糊C均值聚類
2017-11-22 11:51:139 CFSFDP是基于密度的新型聚類算法,可聚類非球形數據集,具有聚類速度快、實現簡單等優(yōu)點。然而該算法在指定全局密度閾值d時未考慮數據空間分布特性,導致聚類質量下降,且無法對多密度峰值的數據集準確聚類
2017-11-21 15:08:5715 傳統(tǒng)kmeans算法由于初始聚類中心的選擇是隨機的,因此會使聚類結果不穩(wěn)定。針對這個問題,提出一種基于離散量改進k-means初始聚類中心選擇的算法。算法首先將所有對象作為一個大類,然后不斷從對象
2017-11-20 10:03:232 為解決傳統(tǒng)BIRCH算法對數據對象輸入順序敏感、聚類結果不穩(wěn)定的問題,提出了一種改進的BIRCH算法。該算法將雷達信號偵察數據的脈沖載頻、脈沖重復間隔和脈沖寬度分別進行聚類,根據工程應用中各參數
2017-11-10 15:52:181 為了提高WSN節(jié)點定位精度,針對測距誤差對定位結果的影響,提出基于模糊C均值聚類的定位算法。算法首先利用多邊定位算法得到若干個定位結果,利用模糊C均值聚類算法對定位結果進行聚類分析,然后,根據聚類
2017-11-09 17:47:1310 在數據挖掘算法中,K均值聚類算法是一種比較常見的無監(jiān)督學習方法,簇間數據對象越相異,簇內數據對象越相似,說明該聚類效果越好。然而,簇個數的選取通常是由有經驗的用戶預先進行設定的參數。本文提出了一種
2017-11-03 16:13:0512 馬爾科夫聚類算法( Markov Cluster Algorithm,MCL)是一種快速且可擴展的無監(jiān)督圖聚類算法,Chameleon是一種新的層次聚類算法。但MCL由于過擬合會產生很多小聚類
2017-10-31 18:58:212 。提出一種基于優(yōu)化粒子群算法的云存儲中大數據優(yōu)化聚類算法,進行了云存儲大數據聚類的原理分析,在傳統(tǒng)的模糊C均值聚類的基礎上,采用粒子群聚類算法進行大數據聚類算法改進設計,把數據的分割轉化為對空間的分割,得到
2017-10-28 12:46:531 聚類分析計算方法主要有如下幾種:劃分法、層次法、密度算法、圖論聚類法、網格算法和模型算法。劃分法(partitioning methods),給定一個有N個元組或者紀錄的數據集,分裂法將構造K個分組,每一個分組就代表一個聚類,K《N。
2017-10-25 19:18:34165890 鑒于主元分析法的降維特性和模糊C均值聚類算法良好的分類性能,本文在丙烯睛反應器操作參數的優(yōu)化中,結合這兩種方法,將主元分析處理后的數據作為新的樣本輸入,利用模糊C均值聚類算法進行優(yōu)化操作。
2017-09-08 15:48:039 基于加速k均值的譜聚類圖像分割算法改進_李昌興
2017-03-19 19:25:560 基于改進K_means聚類的欠定盲分離算法_柴文標
2017-03-17 10:31:390 基于PCA的H_K聚類算法研究_何瑩
2017-03-17 08:00:000 基于SVD的K_means聚類協同過濾算法_王偉
2017-03-17 08:00:000 基于改進K均值聚類的機械故障智能檢測_費賢舉
2017-02-08 01:57:370 特征加權和優(yōu)化劃分的模糊C均值聚類算法_肖林云
2017-01-07 21:39:440 混合細菌覓食和粒子群的k_means聚類算法_閆婷
2017-01-07 19:00:390 基于聚類中心優(yōu)化的k_means最佳聚類數確定方法_賈瑞玉
2017-01-07 18:56:130 基于AutoEncoder的增量式聚類算法_原旭
2017-01-03 17:41:320 基于最小生成樹的層次K_means聚類算法_賈瑞玉
2017-01-03 15:24:455 模糊C-均值聚類算法是一種無監(jiān)督圖像分割技術,但存在著初始隸屬度矩陣隨機選取的影響,可能收斂到局部最優(yōu)解的缺點。提出了一種粒子群優(yōu)化與模糊C-均值聚類相結合的圖像分割算
2012-10-16 16:07:0621 介紹了K-means 聚類算法的目標函數、算法流程,并列舉了一個實例,指出了數據子集的數目K、初始聚類中心選取、相似性度量和距離矩陣為K-means聚類算法的3個基本參數。總結了K-means聚
2012-05-07 14:09:1427 針對數據在性態(tài)和類屬方面存在不確定性的特點,提出一種基于模糊C 均值聚類的數據流入侵檢測算法,該算法首先利用增量聚類得到網絡數據的概要信息和類數,然后利用模糊C均值聚
2012-03-20 10:29:2135 聚類算法及聚類融合算法研究首先對 聚類算法 的特點進行了分析,然后對聚類融合算法進行了挖掘。最后得出聚類融合算法比聚類算法更能得到很好的聚合效果。
2011-08-10 15:08:0233 傳統(tǒng)無線傳感網一般由大量密集的傳感器節(jié)點構成,存在節(jié)點計算能力、能源和帶寬都非常有限的缺點,為了有效節(jié)能、延長網絡壽命,介紹了基于聚類的K均值算法。該算法通過生成的
2011-04-12 18:16:5449 該文針對聚類問題上缺乏骨架研究成果的現狀,分析了聚類問題的近似骨架特征,設計并實現了近似骨架導向的歸約聚類算法。該算法的基本思想是:首先利用現有的啟發(fā)式聚類算
2010-02-10 11:48:095 該文針對K 均值聚類算法存在的缺點,提出一種改進的粒子群優(yōu)化(PSO)和K 均值混合聚類算法。該算法在運行過程中通過引入小概率隨機變異操作增強種群的多樣性,提高了混合聚類
2010-02-09 14:21:2610 文本聚類是中文文本挖掘中的一種重要分析方法。K 均值聚類算法是目前最為常用的文本聚類算法之一。但此算法在處理高維、稀疏數據集等問題時存在一些不足,且對初始聚類
2010-01-15 14:24:4610 本文通過對常用動態(tài)聚類方法的分析,提出了基于“約簡-優(yōu)化”原理的兩階段動態(tài)聚類算法的框架,此方法克服了動態(tài)聚類搜索空間過大的問題,提高了聚類的精度和效率。
2010-01-09 11:31:1412 針對二叉樹支持向量機在多類分類問題上存在的不足,利用粒子群算法對模糊C 均值聚類算法進行了改進,在此基礎上,結合二叉樹支持向量機,構建了偏二叉樹多類分類算法。
2009-12-18 16:36:1612 聚類算法研究:對近年來聚類算法的研究現狀與新進展進行歸納總結.一方面對近年來提出的較有代表性的聚類算法,從算法思想、關鍵技術和優(yōu)缺點等方面進行分析概括;另一方面選擇
2009-10-31 08:57:2414 基于關聯規(guī)則與聚類算法的查詢擴展算法:針對信息檢索中查詢關鍵詞與文檔用詞不匹配的問題,提出一種基于關聯規(guī)則與聚類算法的查詢擴展算法。該算法在第1 階段對初始查
2009-10-17 23:00:3312 針對模糊C-均值(FCM)算法不能很好地處理更新數據的缺點,提出基于FCM 的自適應增量式聚類算法AIFCM。該算法結合密度和集合的思想,給出一種自動確定聚類初始中心的方法,能在
2009-10-04 14:09:0911 Web文檔聚類中k-means算法的改進
介紹了Web文檔聚類中普遍使用的、基于分割的k-means算法,分析了k-means算法所使用的向量空間模型和基于距離的相似性度量的局限性,從而
2009-09-19 09:17:03913 針對CRM 客戶分類,提出模擬退火算法與K 均值算法相結合的聚類算法。利用模擬退火算法全局尋優(yōu)能力改變k 均值算法易陷入局部極值的缺點。經標準數據集檢驗,證明算法有效
2009-09-15 16:16:378 目前應用最廣泛的模糊聚類算法是基于目標函數的模糊k-均值算法,針對該算法存在的缺點,本文提出一種改進的聚類算法,利用遺傳算法的全局優(yōu)化的特點,在能夠在正確獲得
2009-09-07 15:35:428 提出了一種多密度網格聚類算法GDD。該算法主要采用密度閾值遞減的多階段聚類技術提取不同密度的聚類,使用邊界點處理技術提高聚類精度,同時對聚類結果進行了人工干預。G
2009-08-27 14:35:5811 通過比較入侵檢測和人工免疫兩個系統(tǒng)間的相似性,提出了一種基于人工免疫原理的入侵檢測系統(tǒng)模型。運用K均值算法對人工免疫系統(tǒng)中的抗原和抗體進行聚類,對該算法進行了
2009-08-04 09:33:0018 K-均值算法是一種基于樣本間相似性度量的間接聚類方法。本文研究和探索K-均值方法在巖相識別中的應用。在求樣本間的距離時,采用馬氏(Mahalanobis)距離代替歐氏距離。關鍵詞
2009-07-08 08:56:565 傳統(tǒng)K均值算法對初始聚類中心敏感,聚類結果隨不同的初始輸入而波動,容易陷入局部最優(yōu)值。針對上述問題,該文提出一種基于遺傳算法的K均值聚類算法,將K均值算法的局部尋
2009-04-13 09:59:2222 提出了一種新的層次聚類算法,先對數據集進行采樣,以采樣點為中心吸收鄰域內的數據點形成子簇,再根據子簇是否相交實現層次聚類。在層次聚類過程中,重新定義了簇與簇
2009-03-03 11:48:1919
評論
查看更多