一種基于k近鄰圖的稀有類檢測算法
大?。?/span>1.53 MB 人氣: 2018-01-09 需要積分:3
標簽:檢測算法(25177)
稀有類檢測的目標是為無類別標簽的數(shù)據(jù)集中的每個類,特別是僅含少量數(shù)據(jù)樣本的稀有類,尋找到至少一個數(shù)據(jù)樣本以證明數(shù)據(jù)集中存在這些類.該技術在金融欺詐檢測及網(wǎng)絡入侵檢測等現(xiàn)實問題中具有廣泛的應用場景.但是,現(xiàn)有的稀有類檢測算法往往存在以下問題:(1)時間復雜度比較高;或(2)對原始數(shù)據(jù)集需要一定的先驗知識。如數(shù)據(jù)集中各類數(shù)據(jù)樣本所占比例等.提出了一種基于K鄰近圖的無先驗快速稀有類檢測算法KRED,通過利用稀有類數(shù)據(jù)樣本在小范圍內(nèi)緊密分布所造成的與周邊數(shù)據(jù)分布的不一致性來定位稀有類.為此,KRED將給定數(shù)據(jù)集轉化為K鄰近圖,并計算圖中各頂點入度和邊長的變化.最后,將以上變化最大的頂點對應的數(shù)據(jù)樣本作為稀有類的候選樣本.實驗結果表明:KRED有效提高了發(fā)現(xiàn)數(shù)據(jù)集中各個類的效率,明顯縮短了算法運行所需時間.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%