基于貝葉斯概率估計的類屬數(shù)據(jù)聚類算法
大?。?/span>0.90 MB 人氣: 2017-12-04 需要積分:1
針對類屬型數(shù)據(jù)聚類中對象間距離函數(shù)定義的困難問題,提出一種基于貝葉斯概率估計的類屬數(shù)據(jù)聚類算法。首先,提出一種屬性加權的概率模型,在這個模型中每個類屬屬性被賦予一個反映其重要性的權重;其次,經過貝葉斯公式的變換,定義了基于最大似然估計的聚類優(yōu)化目標函數(shù),并提出了一種基于劃分的聚類算法,該算法不再依賴于對象間的距離,而是根據(jù)對象與數(shù)據(jù)集劃分間的加權似然進行聚類;第三,推導了計算屬性權重的表達式,得出了類屬型屬性權重與其符號分布的信息熵成反比的結論。在實際數(shù)據(jù)和合成數(shù)據(jù)集上進行了實驗,結果表明,與基于距離的現(xiàn)有聚類算法相比,所提算法提高了聚類精度,特別是在生物信息學數(shù)據(jù)上取得了5% - 48%的提升幅度,并可以獲得有實際意義的屬性加權結果。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%