0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PageRank算法所建立的模型

lviY_AI_shequ ? 來源:未知 ? 作者:李倩 ? 2018-09-12 16:17 ? 次閱讀

引言

PageRank是Sergey Brin與Larry Page于1998年在WWW7會議上提出來的,用來解決鏈接分析中網(wǎng)頁排名的問題。在衡量一個網(wǎng)頁的排名,直覺告訴我們:

當一個網(wǎng)頁被更多網(wǎng)頁所鏈接時,其排名會越靠前;

排名高的網(wǎng)頁應(yīng)具有更大的表決權(quán),即當一個網(wǎng)頁被排名高的網(wǎng)頁所鏈接時,其重要性也應(yīng)對應(yīng)提高。

對于這兩個直覺,PageRank算法所建立的模型非常簡單:一個網(wǎng)頁的排名等于所有鏈接到該網(wǎng)頁的網(wǎng)頁的加權(quán)排名之和:

表示i個網(wǎng)頁的PageRank值,用以衡量每一個網(wǎng)頁的排名;若排名越高,則其PageRank值越大。網(wǎng)頁之間的鏈接關(guān)系可以表示成一個有向圖,邊代表了網(wǎng)頁j鏈接到了網(wǎng)頁i;為網(wǎng)頁j的出度,也可看作網(wǎng)頁j的外鏈數(shù)( the number of out-links)。

假定為n維PageRank值向量,A為有向圖G所對應(yīng)的轉(zhuǎn)移矩陣,

n個等式(1)改寫為矩陣相乘:

但是,為了獲得某個網(wǎng)頁的排名,而需要知道其他網(wǎng)頁的排名,這不就等同于“是先有雞還是先有蛋”的問題了么?幸運的是,PageRank采用power iteration方法破解了這個問題怪圈。欲知詳情,請看下節(jié)分解。

求解

為了對上述及以下求解過程有個直觀的了解,我們先來看一個例子,網(wǎng)頁鏈接關(guān)系圖如下圖所示:

那么,矩陣A即為

所謂power iteration,是指先給定一個P的初始值,然后通過多輪迭代求解:

最后收斂于,即差別小于某個閾值。我們發(fā)現(xiàn)式子(2)為一個特征方程(characteristic equation),并且解P是當特征值(eigenvalue)為1時的特征向量(eigenvector)。為了滿足(2)是有解的,則矩陣AA應(yīng)滿足如下三個性質(zhì):

stochastic matrix,則行至少存在一個非零值,即必須存在一個外鏈接(沒有外鏈接的網(wǎng)頁被稱為dangling pages);

不可約(irreducible),即矩陣A所對應(yīng)的有向圖G必須是強連通的,對于任意兩個節(jié)點u,v∈V,存在一個從u到v的路徑;

非周期性(aperiodic),即每個節(jié)點存在自回路。

顯然,一般情況下矩陣A這三個性質(zhì)均不滿足。為了滿足性質(zhì)stochastic matrix,可以把全為0的行替換為e/ne/n,其中e為單位向量;同時為了滿足性質(zhì)不可約、非周期,需要做平滑處理:

其中,d為 damping factor,常置為0與1之間的一個常數(shù);E為單位陣。那么,式子(1)被改寫為

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4592

    瀏覽量

    92538
  • PageRank
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6649

原文標題:【十大經(jīng)典數(shù)據(jù)挖掘算法】PageRank

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    請問如何建立XTR110KU的Spice模型?

    怎么建立XTR110KU的Spice模型
    發(fā)表于 09-02 06:11

    請問如何建立MOS或IGBT模型到TINA TI使用?

    請問如何建立MOS或IGBT模型到TINA TI使用
    發(fā)表于 08-14 06:21

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術(shù)依賴于多種先進的AI算法模型。以下將詳細介紹幾種常見的計算機視覺
    的頭像 發(fā)表于 07-24 12:46 ?558次閱讀

    AI算法/模型/框架/模型庫的含義、區(qū)別與聯(lián)系

    在人工智能(Artificial Intelligence,簡稱AI)的廣闊領(lǐng)域中,算法模型、框架和模型庫是構(gòu)成其技術(shù)生態(tài)的重要基石。它們各自承擔著不同的角色,但又緊密相連,共同推動著AI技術(shù)的不斷發(fā)展。以下是對這四者含義、區(qū)
    的頭像 發(fā)表于 07-17 17:11 ?2746次閱讀

    ai大模型算法有什么區(qū)別

    AI大模型算法是人工智能領(lǐng)域的兩個重要概念,它們在很多方面有著密切的聯(lián)系,但同時也存在一些明顯的區(qū)別。 定義和概念 AI大模型通常是指具有大量參數(shù)和復(fù)雜結(jié)構(gòu)的人工智能模型,它們能夠處
    的頭像 發(fā)表于 07-16 10:09 ?1422次閱讀

    如何使用PyTorch建立網(wǎng)絡(luò)模型

    PyTorch是一個基于Python的開源機器學(xué)習(xí)庫,因其易用性、靈活性和強大的動態(tài)圖特性,在深度學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用。本文將從PyTorch的基本概念、網(wǎng)絡(luò)模型構(gòu)建、優(yōu)化方法、實際應(yīng)用等多個方面,深入探討使用PyTorch建立網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 14:08 ?344次閱讀

    基于神經(jīng)網(wǎng)絡(luò)算法模型構(gòu)建方法

    神經(jīng)網(wǎng)絡(luò)是一種強大的機器學(xué)習(xí)算法,廣泛應(yīng)用于各種領(lǐng)域,如圖像識別、自然語言處理、語音識別等。本文詳細介紹了基于神經(jīng)網(wǎng)絡(luò)算法模型構(gòu)建方法,包括數(shù)據(jù)預(yù)處理、網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計、訓(xùn)練過程優(yōu)化、模型
    的頭像 發(fā)表于 07-02 11:21 ?411次閱讀

    建立神經(jīng)網(wǎng)絡(luò)模型的三個步驟

    建立神經(jīng)網(wǎng)絡(luò)模型是一個復(fù)雜的過程,涉及到多個步驟和細節(jié)。以下是對建立神經(jīng)網(wǎng)絡(luò)模型的三個主要步驟的介紹: 第一步:數(shù)據(jù)準備 1.1 數(shù)據(jù)收集 數(shù)據(jù)是神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。首先,你需要收集足夠的
    的頭像 發(fā)表于 07-02 11:20 ?668次閱讀

    深度學(xué)習(xí)模型訓(xùn)練過程詳解

    深度學(xué)習(xí)模型訓(xùn)練是一個復(fù)雜且關(guān)鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法。訓(xùn)練一個深度學(xué)習(xí)模型,本質(zhì)上是通過優(yōu)化算法調(diào)整模型參數(shù),
    的頭像 發(fā)表于 07-01 16:13 ?1033次閱讀

    數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響

    數(shù)據(jù)語料庫、算法框架和算力芯片的確是影響AI大模型發(fā)展的三大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?936次閱讀

    拆解大語言模型RLHF中的PPO算法

    由于本文以大語言模型 RLHF 的 PPO 算法為主,所以希望你在閱讀前先弄明白大語言模型 RLHF 的前兩步,即 SFT Model 和 Reward Model 的訓(xùn)練過程。另外因為本文不是純講強化學(xué)習(xí)的文章,所以我在敘述的
    的頭像 發(fā)表于 12-11 18:30 ?2029次閱讀
    拆解大語言<b class='flag-5'>模型</b>RLHF中的PPO<b class='flag-5'>算法</b>

    有哪幾種方法可以對Saber MAST模型進行加密呢?

    為保護知識產(chǎn)權(quán),我們有時候需要對自己所建模型進行加密,加密使得別人無法讀取模型的部分源代碼。
    的頭像 發(fā)表于 12-05 13:50 ?650次閱讀
    有哪幾種方法可以對Saber MAST<b class='flag-5'>模型</b>進行加密呢?

    機器人的ROS模型建立

    這個系列主要介紹機器人ROS模型建立方法,ROS系統(tǒng)帶來的好處之一就是: 我們無需自己建立復(fù)雜的數(shù)學(xué)模型來描述自己的機器人幾何尺寸、運動學(xué)和動力學(xué)等,只需要用它提供的
    的頭像 發(fā)表于 11-28 14:19 ?566次閱讀

    中偉視界:突破技術(shù)壁壘,構(gòu)建高性能AI算法模型平臺

    搭建AI算法模型自訓(xùn)練平臺面臨諸多技術(shù)難點,如高效算法模型、強大的數(shù)據(jù)管理及存儲能力、模型評估和優(yōu)化等。解決方法包括分布式計算、深度學(xué)習(xí)、自
    的頭像 發(fā)表于 11-27 09:18 ?343次閱讀

    剛性機械臂的動力學(xué)建模

    剛性機械臂 機械臂建模是機械臂控制的基礎(chǔ),控制效果的好壞很大程度上決定于所建立的動力學(xué)模型的準確性。 目前對剛性機械臂的動力學(xué)建模方法較多,理論較為成熟。而對于柔性空間機械臂的精確建模尚處在研究階段
    的頭像 發(fā)表于 11-17 17:03 ?776次閱讀