您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

大文本數(shù)據(jù)集的間接譜聚類

大?。?/span>0.59 MB 人氣: 2018-02-24 需要積分:1

  針對譜聚類存在計算瓶頸的問題,提出了一種快速的集成算法,稱為間接譜聚類。它首先運用K-Means算法對數(shù)據(jù)集進行過分聚類,然后把每個過分簇看成一個基本對象,最后在過分簇的級別上利用標準譜聚類來完成總體的聚類。將該思想應用于大文本數(shù)據(jù)集的聚類問題后,過分簇中心之間的相似性度度量方法可以采用常用的余弦距離法。在20-Newgroups大本數(shù)據(jù)上的實驗結(jié)果表明:間接譜聚類算法在聚類準確性上比K-Means算法平均高出14. 72%;比規(guī)范割譜聚類僅低0.88%,但算法所需的計算時間平均不到規(guī)范割譜聚類的1/16,且隨著數(shù)據(jù)集的增大當規(guī)范割譜聚類遭遇計算瓶頸時,提出的算法卻能快速地給出次優(yōu)解。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?