大文本數(shù)據(jù)集的間接譜聚類
大?。?/span>0.59 MB 人氣: 2018-02-24 需要積分:1
針對譜聚類存在計算瓶頸的問題,提出了一種快速的集成算法,稱為間接譜聚類。它首先運用K-Means算法對數(shù)據(jù)集進行過分聚類,然后把每個過分簇看成一個基本對象,最后在過分簇的級別上利用標準譜聚類來完成總體的聚類。將該思想應用于大文本數(shù)據(jù)集的聚類問題后,過分簇中心之間的相似性度度量方法可以采用常用的余弦距離法。在20-Newgroups大本數(shù)據(jù)上的實驗結(jié)果表明:間接譜聚類算法在聚類準確性上比K-Means算法平均高出14. 72%;比規(guī)范割譜聚類僅低0.88%,但算法所需的計算時間平均不到規(guī)范割譜聚類的1/16,且隨著數(shù)據(jù)集的增大當規(guī)范割譜聚類遭遇計算瓶頸時,提出的算法卻能快速地給出次優(yōu)解。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
大文本數(shù)據(jù)集的間接譜聚類下載
相關(guān)電子資料下載
- 人臉識別模型訓練失敗原因有哪些 135
- 反向傳播神經(jīng)網(wǎng)絡(luò)分為多少層 162
- 神經(jīng)網(wǎng)絡(luò)預測誤差大小怎么看 130
- PyTorch如何訓練自己的數(shù)據(jù)集 89
- MES、ERP、PLM等工業(yè)系統(tǒng)的數(shù)據(jù)集成方案 143
- 機器學習的經(jīng)典算法與應用 1093
- 定制化、精細化、場景化AI訓練數(shù)據(jù)趨于基礎(chǔ)數(shù)據(jù)服務市場主流 75
- 經(jīng)證實,深度技術(shù)人才的素質(zhì)能夠預測以人工智能為中心的公司未來的創(chuàng)新潛力 236
- 鹽城市大數(shù)據(jù)集團攜手百望云 以MaaS推進數(shù)字經(jīng)濟躍遷 108
- 東軟與福建省大數(shù)據(jù)集團聯(lián)合打造“數(shù)據(jù)要素×醫(yī)療健康”服務新模式 263