基于混合人工免疫算法的流程挖掘事件日志融合方法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
流程挖掘是流程管理和數(shù)據(jù)挖掘交叉領(lǐng)域中的一個(gè)研究熱點(diǎn),在實(shí)際業(yè)務(wù)環(huán)境中,流程執(zhí)行的數(shù)據(jù)往往分散記錄到不同的事件日志中,需要將這些事件日志融合成為單一事件日志文件,才能應(yīng)用當(dāng)前基于單一事件日志的流程挖掘技術(shù).然而,由于流程日志間存在著執(zhí)行實(shí)例的多對(duì)多匹配關(guān)系、融合所需信息可能缺失等問(wèn)題,導(dǎo)致事件日志融合問(wèn)題具有較高挑戰(zhàn)性.本文對(duì)事件日志融合問(wèn)題進(jìn)行了形式化定義,指出該問(wèn)題是一個(gè)搜索優(yōu)化問(wèn)題,并提出了一種基于混合人工免疫算法的事件日志融合方法:以啟發(fā)式方法生成初始種群。人工免疫系統(tǒng)的克隆選擇理論基礎(chǔ),通過(guò)免疫進(jìn)化獲得“最佳”的融合解,從而支持包含多對(duì)多的實(shí)例匹配關(guān)系的日志融合;考慮兩個(gè)實(shí)例級(jí)別的因素:流程執(zhí)行路徑出現(xiàn)的頻次和流程實(shí)例間的時(shí)間匹配關(guān)系。分別從“量”匹配和“時(shí)間”匹配兩個(gè)維度來(lái)評(píng)價(jià)進(jìn)化中的個(gè)體;通過(guò)設(shè)置免疫記憶庫(kù)、引入模擬退火機(jī)制,保證新一代種群的多樣性,減少進(jìn)化早熟幾率.實(shí)驗(yàn)結(jié)果表明,本文的方法能夠?qū)崿F(xiàn)多對(duì)多的實(shí)例匹配關(guān)系的事件日志融合的目標(biāo)。相比隨機(jī)方法生成初始種群。啟發(fā)式方法能加快免疫進(jìn)化的速度.文中還針對(duì)利用分布式技術(shù)提高事件日志融合性能,探討了大規(guī)模事件日志的分布式融合中的數(shù)據(jù)劃問(wèn)題.
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%