基于差異度的不均衡電信客戶數(shù)據(jù)分類方法
大小:0.94 MB 人氣: 2017-12-04 需要積分:1
針對傳統(tǒng)分類技術(shù)對不均衡電信客戶數(shù)據(jù)集中流失客戶識別能力不足的問題,提出一種基于差異度的改進型不均衡數(shù)據(jù)分類(IDBC)算法。該算法在基于差異度分類(DBC)算法的基礎上改進了原型選擇策略。在原型選擇階段,利用改進型的樣本子集優(yōu)化方法從整體數(shù)據(jù)集中選擇最具參考價值的原型集,從而避免了隨機選擇所帶來的不確定性;在分類階段,分別利用訓練集和原型集、測試集和原型集樣本之間的差異性構(gòu)建相應的特征空間,進而采用傳統(tǒng)的分類預測算法對映射到相應特征空間內(nèi)的差異度數(shù)據(jù)集進行學習。最后選用了UCI數(shù)據(jù)庫中的電信客戶數(shù)據(jù)集和另外6個普通的不均衡數(shù)據(jù)集對該算法進行驗證,相對于傳統(tǒng)基于特征的不均衡數(shù)據(jù)分類算法,DBC算法對稀有類的識別率平均提高了8. 3%,IDBC算法對稀有類的識別率平均提高了11. 3%。實驗結(jié)果表明,所提IDBC算法不受類別分布的影響,而且對不均衡數(shù)據(jù)集中稀有類的識別能力優(yōu)于已有的先進分類技術(shù)。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于差異度的不均衡電信客戶數(shù)據(jù)分類方法下載
相關(guān)電子資料下載
- TDengine+OpenVINO+AIxBoard助力時序數(shù)據(jù)分類 421
- 心中有“數(shù)”,Commvault助力企業(yè)主動保護數(shù)據(jù) 384
- 美創(chuàng)暗數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)分類分級系統(tǒng)全新升級 244
- 英諾森參編的行業(yè)標準《數(shù)字化倉庫數(shù)據(jù)分類與接口規(guī)范》召開預審會 258
- 新的量子數(shù)據(jù)分類協(xié)議將使我們更加的接近量子互聯(lián)網(wǎng) 3207
- 基于CNN的大規(guī)模可穿戴傳感器運動數(shù)據(jù)分類 1816
- 導致非平衡數(shù)據(jù)分類性能下降的原因及解決方案的分析 2738