您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于差異度的不均衡電信客戶數(shù)據(jù)分類方法

大小:0.94 MB 人氣: 2017-12-04 需要積分:1

  針對傳統(tǒng)分類技術(shù)對不均衡電信客戶數(shù)據(jù)集中流失客戶識別能力不足的問題,提出一種基于差異度的改進型不均衡數(shù)據(jù)分類(IDBC)算法。該算法在基于差異度分類(DBC)算法的基礎上改進了原型選擇策略。在原型選擇階段,利用改進型的樣本子集優(yōu)化方法從整體數(shù)據(jù)集中選擇最具參考價值的原型集,從而避免了隨機選擇所帶來的不確定性;在分類階段,分別利用訓練集和原型集、測試集和原型集樣本之間的差異性構(gòu)建相應的特征空間,進而采用傳統(tǒng)的分類預測算法對映射到相應特征空間內(nèi)的差異度數(shù)據(jù)集進行學習。最后選用了UCI數(shù)據(jù)庫中的電信客戶數(shù)據(jù)集和另外6個普通的不均衡數(shù)據(jù)集對該算法進行驗證,相對于傳統(tǒng)基于特征的不均衡數(shù)據(jù)分類算法,DBC算法對稀有類的識別率平均提高了8. 3%,IDBC算法對稀有類的識別率平均提高了11. 3%。實驗結(jié)果表明,所提IDBC算法不受類別分布的影響,而且對不均衡數(shù)據(jù)集中稀有類的識別能力優(yōu)于已有的先進分類技術(shù)。

?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?