0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Markov的各種預(yù)測模型的原理與優(yōu)缺點介紹

電子設(shè)計 ? 作者:電子設(shè)計 ? 2018-11-06 08:47 ? 次閱讀

建立有效的用戶瀏覽預(yù)測模型,對用戶的瀏覽做出準(zhǔn)確的預(yù)測,是導(dǎo)航工具實現(xiàn)對用戶瀏覽提供有效幫助的關(guān)鍵。

在瀏覽預(yù)測模型方面,很多學(xué)者都進行了卓有成效的研究。AZER提出了基于概率模型的預(yù)取方法,根據(jù)網(wǎng)頁被連續(xù)訪問的概率來預(yù)測用戶的訪問請求。SARUKKAI運用馬爾可夫鏈進行訪問路徑分析和鏈接預(yù)測,在此模型中,將用戶訪問的網(wǎng)頁集作為狀態(tài)集,根據(jù)用戶訪問記錄,計算出網(wǎng)頁間的轉(zhuǎn)移概率,作為預(yù)測依據(jù)。SCHECHTER構(gòu)造用戶訪問路徑樹,采用最長匹配方法,尋找與當(dāng)前用戶訪問路徑匹配的歷史路徑,預(yù)測用戶的訪問請求。XU Cheng Zhong等引入神經(jīng)網(wǎng)絡(luò)實現(xiàn)基于語義的網(wǎng)頁預(yù)取。徐寶文等利用客戶端瀏覽器緩沖區(qū)數(shù)據(jù),挖掘其中蘊含的興趣關(guān)聯(lián)規(guī)則,預(yù)測用戶可能選擇的鏈接。朱培棟等人按語義對用戶會話進行分類,根據(jù)會話所屬類別的共同特征,預(yù)測用戶可能訪問的文檔。

在眾多的瀏覽模型中,Markov模型是一種簡單而有效的模型。Markov模型最早是ZUKERMAN等人于1999年提出的一種用途十分廣泛的統(tǒng)計模型,它將用戶的瀏覽過程抽象為一個特殊的隨機過程——齊次離散Markov模型,用轉(zhuǎn)移概率矩陣描述用戶的瀏覽特征,并基于此對用戶的瀏覽進行預(yù)測。之后,BOERGES等采用了多階轉(zhuǎn)移矩陣,進一步提高了模型的預(yù)測準(zhǔn)確率。在此基礎(chǔ)上,SARUKKAI建立了一個實驗系統(tǒng)[9],實驗表明,Markov預(yù)測模型很適合作為一個預(yù)測模型來預(yù)測用戶在Web站點上的訪問模式。

1 Markov模型

1.1 Markov模型

Markov預(yù)測模型對用戶在Web上的瀏覽過程作了如下的假設(shè)。

假設(shè)1(用戶瀏覽過程假設(shè)):假設(shè)所有用戶在Web上的瀏覽過程是一個特殊的隨機過程——齊次的離散Markov模型。即設(shè)離散隨機變量的值域為Web空間中的所有網(wǎng)頁構(gòu)成的集合,則一個用戶在Web中的瀏覽過程就構(gòu)成一個隨機變量的取值序列,并且該序列滿足Markov性。

一個離散的Markov預(yù)測模型可以被描述成三元組,S代表狀態(tài)空間;A是轉(zhuǎn)換矩陣,表示從一個狀態(tài)轉(zhuǎn)換到另一個狀態(tài)的概率;B是S中狀態(tài)的初始概率分布。其中S是一個離散隨機變量,值域為{x1,x2,…xn},其中每個xi對應(yīng)一個網(wǎng)頁,稱為模型的一個狀態(tài)。

Markov預(yù)測模型是一個典型的無后效性隨機過程,也就是說模型在時刻t的狀態(tài)只與它的前一個時刻t-1的狀態(tài)條件相關(guān),與以前的狀態(tài)獨立。即:

Markov的各種預(yù)測模型的原理與優(yōu)缺點介紹

王實等提出一種新的基于隱馬爾可夫模型的興趣遷移模式發(fā)現(xiàn)方法,并利用用戶遷移模式間的關(guān)聯(lián)規(guī)則來發(fā)現(xiàn)興趣遷移模式。而借助隱馬爾可夫模型, 挖掘蘊涵在用戶訪問路徑中的信息需求概念, 以此進行預(yù)取頁面的評價, 也可以實現(xiàn)基于語義的網(wǎng)頁預(yù)取。

隱Markov模型盡管考慮了用戶興趣,但和簡單的Markov模型一樣,存在一定的不足:用戶訪問序列串長是動態(tài)時變的,采用固定階數(shù)的傳統(tǒng)Markov鏈模型并不能準(zhǔn)確地對用戶的訪問行為建模。

2.2 多Markov模型

雖然用戶在Web空間的瀏覽過程是一個受瀏覽目的、文化背景、興趣愛好等多種因素影響的復(fù)雜過程,有很多差異,然而觀察大量用戶的瀏覽過程可以發(fā)現(xiàn),某些用戶的瀏覽過程表現(xiàn)出相同或相近的特點,如他們?yōu)g覽的網(wǎng)頁基本相同,瀏覽各個網(wǎng)頁的順序相似等,這一現(xiàn)象引發(fā)了對Web用戶分類的研究。通過對用戶分類,同一類別的用戶用同一個模型來描述它,而不同類別的用戶其瀏覽過程差別較大,用不同的模型來描述他們的特征則更為合理。

假設(shè)2(用戶分類假設(shè)):假設(shè)根據(jù)用戶在Web空間的瀏覽特點,可以將所有用戶分為K類。如果用C={c1, c2,…,ck}表示用戶的類別,則任意一個用戶屬于類別ck的概率為P(C=ck),而且有:

Markov的各種預(yù)測模型的原理與優(yōu)缺點介紹

上述模型稱為二步Markov模型,它的核心任務(wù)是建立一個與一階Markov模型的轉(zhuǎn)移概率矩陣同規(guī)模的轉(zhuǎn)移概率矩陣。矩陣的行元素代表用戶瀏覽的上一個網(wǎng)頁,列元素代表用戶下一步可能瀏覽的網(wǎng)頁。通過該矩陣可以根據(jù)用戶上一步瀏覽的網(wǎng)頁來預(yù)測下一步要瀏覽的網(wǎng)頁。

Markov的各種預(yù)測模型的原理與優(yōu)缺點介紹

在多Markov模型方面,劉業(yè)政等提出可變多階Markov鏈模型VMOMC。VMOMC將用推薦目標(biāo)網(wǎng)頁概率值度量的可變多階Markov鏈并行組合,組合模型中采用遺傳算法確定各單階Markov鏈模型的最優(yōu)權(quán)重。陳佳提出了基于混合模型的一種挖掘用戶群在頁面上興趣分布程度的模式發(fā)現(xiàn),計算用戶群從一個頁面到另外一個頁面的導(dǎo)航路徑模式的概率大小,可得到大量的用戶對所訪問Web的興趣及導(dǎo)航模式,從而預(yù)測用戶的瀏覽路徑。

2.4 結(jié)構(gòu)相關(guān)性模型

有研究表明,用戶在進行Web瀏覽的絕大部分時間里都是從當(dāng)前頁面中挑選一個鏈接繼續(xù)瀏覽;在用戶將來訪問的網(wǎng)頁中,46%能在最近3個網(wǎng)頁的鏈接中找到,75%能在所有歷史網(wǎng)頁的鏈接中找到 。因此,可以認(rèn)為用戶將來的可能請求大部分存在于由當(dāng)前頁面上所有鏈接組成的集合中?;诮Y(jié)構(gòu)相關(guān)性的一階Markov模型包括以下三部分:

Markov的各種預(yù)測模型的原理與優(yōu)缺點介紹

通過遍歷用戶訪問序列的節(jié)點,可以得到用戶的狀態(tài)空間和轉(zhuǎn)移情況,并最終建立上述模型。

結(jié)合頁面內(nèi)容及站點結(jié)構(gòu)來調(diào)整狀態(tài)轉(zhuǎn)移矩陣,以獲得更精確的預(yù)取結(jié)果,提高Web 服務(wù)的質(zhì)量。而利用頻繁訪問模式樹存儲Markov鏈,能夠大幅減小存儲空間。

3 進一步研究的問題

盡管現(xiàn)有的Markov 瀏覽預(yù)測模型在預(yù)測準(zhǔn)確率、覆蓋率方面已取得較滿意的成果,但瀏覽預(yù)測問題的實際應(yīng)用背景中的一些特殊要求使得這一領(lǐng)域仍存在一些需要進一步研究的問題。這些問題包括:

(1)Markov轉(zhuǎn)移概率矩陣的處理。該模型的存儲空間主要用于保存狀態(tài)轉(zhuǎn)移概率矩陣,所以其存儲空間的復(fù)雜度是網(wǎng)頁數(shù)目n的平方,即為0(n)。由于n的值一般都比較大,存儲復(fù)雜率較高。同時為了提高Web預(yù)取的命中率,常常聯(lián)合多個Markov鏈模型,即用到了多階狀態(tài)轉(zhuǎn)移矩陣,使得存儲復(fù)雜率成倍提高。因此如何存儲及處理Markov模型的概率矩陣、降低復(fù)雜度是急需解決的問題。此外,在很多情況下狀態(tài)轉(zhuǎn)移矩陣是稀疏矩陣,采用什么樣的數(shù)據(jù)結(jié)構(gòu)來存儲這樣的矩陣也是需要研究的課題。

(2)混合Markov模型的求解問題。混合Markov模型在預(yù)測用戶的瀏覽行為方面越來越受到學(xué)者的重視。有效的模型求解方法,能大大提高模型的效率。雖有學(xué)者進行了有益的探索,但這方面的工作仍需要更多學(xué)者的參與。

(3)在實際瀏覽預(yù)測問題中,Markov的隨機統(tǒng)計方法與其他方法,如神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、聚類、關(guān)聯(lián)規(guī)則、遺傳算法等相結(jié)合能獲得較高的預(yù)測準(zhǔn)確率。

(4)用戶在Web空間的瀏覽過程是一個受瀏覽目的、

文化背景、興趣愛好等多種因素影響的復(fù)雜動態(tài)過程,如能有效地度量用戶的瀏覽興趣,并及時發(fā)現(xiàn)用戶的興趣遷移,對于提高預(yù)測準(zhǔn)確率非常重要。此外,隨著無線網(wǎng)絡(luò)的普及,怎樣預(yù)測無線網(wǎng)絡(luò)環(huán)境下用戶的瀏覽行為,是研究人員面臨的又一個課題。

全文概述了基于Markov的各種預(yù)測模型,分析了各個模型的原理及優(yōu)缺點,指出了今后的研究方向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4733

    瀏覽量

    100400
  • 瀏覽器
    +關(guān)注

    關(guān)注

    1

    文章

    1008

    瀏覽量

    35218
  • 網(wǎng)頁
    +關(guān)注

    關(guān)注

    0

    文章

    72

    瀏覽量

    19272
收藏 人收藏

    評論

    相關(guān)推薦

    天線各種材質(zhì)的優(yōu)缺點

    目前的工作需要接觸到天線,但是對于天線基本上不了解。這些天從網(wǎng)上了解到天線的材質(zhì)大概分為:彈片、PCB、FPC、陶瓷和LDS這幾類,不知道這幾種材質(zhì)的優(yōu)缺點都有哪些呢?
    發(fā)表于 01-28 16:18

    SPI協(xié)議的優(yōu)缺點

    SPI協(xié)議介紹SPI協(xié)議的優(yōu)缺點
    發(fā)表于 12-24 06:29

    LED技術(shù)的優(yōu)缺點

    LED技術(shù)的優(yōu)缺點介紹
    發(fā)表于 01-01 06:05

    SPICE模型有什么優(yōu)缺點?如何合理的使用SPICE模型

    請問SPICE模型有什么優(yōu)缺點?如何合理的使用SPICE模型?
    發(fā)表于 04-13 06:59

    模型預(yù)測控制介紹

    這篇主要講一下模型預(yù)測控制,如果對PID控制了解的同學(xué),那效果更好。如果不了解PID控制,還是熟悉下比較好。模型預(yù)測控制,顧名思義,基于模型
    發(fā)表于 08-18 06:21

    基于Markov與MMTS的移動對象位置預(yù)測算法

    針對低階Markov模型預(yù)測精度較差,以及多階Markov模型預(yù)測稀疏率高的問題,提出一種基于
    發(fā)表于 12-25 15:00 ?0次下載

    衛(wèi)星信道三狀態(tài)Markov模型設(shè)計

    分布模型,引入三狀態(tài)Markov過程實現(xiàn)因天氣變化造成的信道狀態(tài)的轉(zhuǎn)換,構(gòu)成衛(wèi)星信道三狀態(tài)Markov模型并對該模型的統(tǒng)計特性進行分析。最后
    發(fā)表于 12-25 15:25 ?1次下載
    衛(wèi)星信道三狀態(tài)<b class='flag-5'>Markov</b><b class='flag-5'>模型</b>設(shè)計

    各種電容的優(yōu)缺點及應(yīng)用場合和制作及溫度系數(shù)免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是各種電容的優(yōu)缺點及應(yīng)用場合和制作及溫度系數(shù)免費下載。
    發(fā)表于 10-09 08:00 ?36次下載
    <b class='flag-5'>各種</b>電容的<b class='flag-5'>優(yōu)缺點</b>及應(yīng)用場合和制作及溫度系數(shù)免費下載

    西門子伺服電機各種型號的介紹優(yōu)缺點有利于維修

    本文檔的主要內(nèi)容詳細(xì)介紹的是西門子伺服電機各種型號的介紹優(yōu)缺點有利于維修詳細(xì)資料免費下載。
    發(fā)表于 11-09 08:00 ?12次下載

    如何使用Adaboost Markov模型進行移動用戶位置預(yù)測方法的詳細(xì)資料說明

    針對Markov模型在位置預(yù)測中存在預(yù)測精度不高及匹配稀疏等問題,提出了一種基于Adaboost-Markov
    發(fā)表于 03-28 11:29 ?12次下載
    如何使用Adaboost <b class='flag-5'>Markov</b><b class='flag-5'>模型</b>進行移動用戶位置<b class='flag-5'>預(yù)測</b>方法的詳細(xì)資料說明

    各種類型的混頻器及優(yōu)缺點

    在RF和微波設(shè)計中,混頻是信號鏈最關(guān)鍵的部分之一。今天我們就講講各種類型的混頻器以及各自的優(yōu)缺點。
    的頭像 發(fā)表于 10-19 10:26 ?6302次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點

    卷積神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點? 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種從圖像、視頻、聲音和一系列多維信號中進行學(xué)習(xí)的深度學(xué)習(xí)模型。它在計算機視覺、語音識別
    的頭像 發(fā)表于 08-21 17:15 ?4194次閱讀

    igbt的優(yōu)缺點介紹

    igbt的優(yōu)缺點介紹 IGBT的優(yōu)缺點介紹 IGBT是一種晶體管,是MOSFET和BJT集成而成的開關(guān),具有高速開關(guān)能力和較低的導(dǎo)通電阻,用于高效率的功率調(diào)節(jié)。IGBT具有一些優(yōu)點和
    的頭像 發(fā)表于 08-25 15:03 ?7731次閱讀

    數(shù)學(xué)建模神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點有哪些

    、預(yù)測分析等。然而,神經(jīng)網(wǎng)絡(luò)模型也存在一些優(yōu)缺點。本文將詳細(xì)分析神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點。 一、優(yōu)點 強大的非線性擬合能力 神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 11:36 ?757次閱讀

    AI大模型與小模型優(yōu)缺點

    在人工智能(AI)的廣闊領(lǐng)域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度,我們可以將其大致分為AI大模型和小模型。這兩種
    的頭像 發(fā)表于 07-10 10:39 ?2179次閱讀