您好,歡迎來電子發(fā)燒友網! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網>源碼下載>數(shù)值算法/人工智能>

基于Web日志仿真生成WLSG算法

大?。?/span>0.84 MB 人氣: 2017-12-08 需要積分:1

  大數(shù)據規(guī)模的激增,給數(shù)據處理的服務平臺帶來不可預知的后果。對Web服務日志的分析,不僅能夠幫助服務平臺有效預防網絡異常的產生,也能對服務平臺進行壓力測試分析,有利于提升服務平臺的可靠性。然而Web日志中包含用戶隱私信息,企業(yè)及政府等機構極少愿意公開日志供研究人員使用;同時,現(xiàn)已公開的Web日志數(shù)據年代久遠,其特征不符合當前大數(shù)據時代特征H1。如何仿真生成逼真的Web日志,是學術界的熱點問題,也是本文研究的方向。以中國科學院的可伸縮大數(shù)據生成組件(Scalable Big Data Cenerator SuiteBDCS)為代表的Web日志生成器不僅能夠用于Web服務器壓力測試和性能研究,而且具有很高的擴展性。但有一個顯著的缺點是:Web日志的時間依賴性表達能力很弱;以動態(tài)Web代理緩存負載生成器(Proxy Workload Generator.ProWGen)為代表的日志生成器能較好地以時間局部性擬合Web文件特征,卻是采用靜態(tài)分布模型。當前隨著應用需求的日益擴大,要求生成器的仿真性能較高,這給Web日志生成方法帶來了嚴重的挑戰(zhàn)。事實上,當出現(xiàn)熱點時,數(shù)據會表現(xiàn)為突發(fā)性地圍繞熱點動態(tài)變化。但當前已有的Web日志生成器主要是基于靜態(tài)數(shù)據分布設計的,忽略了分布的動態(tài)性和用戶行為的復雜性,雖然引入了Web文件的時間局部性,卻沒有站在時間角度來衡量Web文件的時間局部性。

  針對此問題,本文提出一種動態(tài)仿真模型——基于用戶興趣遷移的Web日志仿真生成(Web Log Simulation Ceneration based on user interest migration, WLSG)算法。該WLSC算法對用戶屬性、Web文件屬性分別和時間的依賴關系進行建模,也融入了用戶興趣遷移以及自適應訪問興趣度高的Web文件,能夠生成具有強的時間依賴性,用戶訪問順序可調,且包含用戶的個性化特征的逼真日志數(shù)據。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?