分層抽樣的K近鄰分類加速算法
大?。?/span>3.04 MB 人氣: 2018-02-27 需要積分:2
標(biāo)簽:分層(11576)
k近鄰(k nearest neighbor,kNN)分類作為數(shù)據(jù)挖掘中最典型的算法之一,以較高的泛化性能以及充足的理論基礎(chǔ)被廣泛應(yīng)用。然而kNN在測試時需要計算待識別實例與所有訓(xùn)練實例之間的距離,以至于在面對大規(guī)模數(shù)據(jù)時需要大量的時間。為此,提出一種基于分層抽樣的kNN加速算法(KNN based on stratified sampling,SS_kNN)。首先將訓(xùn)練實例所在的空間劃分為若干個實例個數(shù)相等的區(qū)域,然后從每個區(qū)域內(nèi)抽取實例,最后判定待識別實例落入劃分區(qū)域中的哪一個,并從此區(qū)域以及相鄰區(qū)域抽取的實例中尋找其K個近鄰。與原始kNN算法以及基于隨機抽樣的kNN算法相比,SSkNN算法可以獲得與其相近分類精度,但將其運行速度分別提高大約399倍和16倍。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%