0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知識(shí)圖譜嵌入模型 (KGE) 的總結(jié)和比較

冬至子 ? 來源:Shreyash Pandey ? 作者:Shreyash Pandey ? 2023-07-31 16:07 ? 次閱讀

知識(shí)圖譜嵌入(KGE)是一種利用監(jiān)督學(xué)習(xí)來學(xué)習(xí)嵌入以及節(jié)點(diǎn)和邊的向量表示的模型。它們將“知識(shí)”投射到一個(gè)連續(xù)的低維空間,這些低維空間向量一般只有幾百個(gè)維度(用來表示知識(shí)存儲(chǔ)的內(nèi)存效率)。向量空間中,每個(gè)點(diǎn)代表一個(gè)概念,每個(gè)點(diǎn)在空間中的位置具有語義意義,類似于詞嵌入。

一個(gè)好的KGE 應(yīng)該具有足夠的表現(xiàn)力來捕獲 KG 屬性,這些屬性解決了表示關(guān)系的獨(dú)特邏輯模式的能力。并且KG 可以根據(jù)要求添加或刪除一些特定屬性。KGE算法可分為兩類:

  • 翻譯距離模型 (translation distance models),如TransE、TransH、TransR、TransD等。
  • 語義匹配模型 (semantic matching models),如DistMult。

以下是常見的KGE 模型在捕獲關(guān)系類型方面的比較,我們將對(duì)這些常見的模型進(jìn)行比較

翻譯距離模型

TransE

提出了一種基于翻譯的知識(shí)圖譜嵌入模型,可以捕獲多關(guān)系圖中的翻譯方差不變性現(xiàn)象。知識(shí)圖譜中的事實(shí)是用三元組 ( h , l , t ) 表示的,transE算法的思想非常簡(jiǎn)單,它受word2vec平移不變性的啟發(fā),希望h + l ≈ t h+l≈th+l≈t。

這里的l1/l2是范數(shù)約束。

TransE的偽代碼如下:

TransE多次在大規(guī)模知識(shí)圖譜方面表現(xiàn)出良好的性能。但是它不能有效地捕獲復(fù)雜的關(guān)系,如一對(duì)多和多對(duì)多。

TransH

TransH根據(jù)關(guān)系為每個(gè)實(shí)體提供不同的表示向量。TransH的工作原理是為每個(gè)關(guān)系發(fā)布一個(gè)完全獨(dú)立的特定于關(guān)系的超平面,這樣與它關(guān)聯(lián)的實(shí)體僅在該關(guān)系的上下文中具有不同的語義。TransH將實(shí)體嵌入向量h和t投影到映射向量W?方向的超平面(關(guān)系特定)。

其中D?表示關(guān)系特定的平移向量,h和t的計(jì)算方法如下:

TransH 在一定程度上解決了復(fù)雜關(guān)系問題。它采用相同的向量特征空間。

TransR

TransR的理念與TransH非常相似。但它引入了特定于關(guān)系的空間,而不是超平面。實(shí)體表示為實(shí)體空間R?中的向量,每個(gè)關(guān)系都與特定空間R?相關(guān)聯(lián),并建模為該空間中的平移向量。給定一個(gè)事實(shí),TransR首先將實(shí)體表示h和t投影到關(guān)系r特定的空間中:

這里M?是一個(gè)從實(shí)體空間到r的關(guān)系空間的投影矩陣,評(píng)分函數(shù)定義為

它能夠?qū)?fù)雜的關(guān)系建模。但是每個(gè)關(guān)系需要O(dk)個(gè)參數(shù)。沒有TransE/TransH的簡(jiǎn)單性和效率。

TransD

TransD是TransR的改進(jìn)。它采用映射矩陣,為頭部和尾部實(shí)體生成兩個(gè)獨(dú)立的映射矩陣。它使用兩個(gè)嵌入向量來表示每個(gè)實(shí)體和關(guān)系。第一個(gè)嵌入向量表示實(shí)體和關(guān)系的語義,第二個(gè)嵌入向量生成兩個(gè)動(dòng)態(tài)投影矩陣,如下圖所示。

評(píng)分函數(shù)如下:

下表是總結(jié)所有翻譯距離模型的對(duì)比

語義匹配模型

RESCAL

RESCAL將每個(gè)實(shí)體與一個(gè)向量相關(guān)聯(lián),捕獲其潛在語義。每個(gè)關(guān)系都表示為一個(gè)矩陣,它模擬了潛在因素之間的成對(duì)相互作用。事實(shí)(h,r,t)的分?jǐn)?shù)由雙線性函數(shù)定義。

其中h,t∈R?是實(shí)體的向量表示,M?∈R?*?是與該關(guān)系相關(guān)的矩陣。這個(gè)分?jǐn)?shù)捕獲了h和t的所有分量之間的成對(duì)相互作用,每個(gè)關(guān)系需要O(d2)個(gè)參數(shù),并進(jìn)一步假設(shè)所有 M? 在一組通用的 rank-1 指標(biāo)上分解。

它最大的問題是計(jì)算復(fù)雜且成本高。

TATEC

TATEC模型不僅有三種相互關(guān)系,它還包含雙向交互,例如實(shí)體和關(guān)系之間的交互。評(píng)分函數(shù)為

其中D是所有不同關(guān)系共享的對(duì)角矩陣。

DistMult

通過將M?限制為對(duì)角矩陣,DistMult簡(jiǎn)化了RESCAL。對(duì)于每個(gè)關(guān)系r,引入一個(gè)向量r∈r?,并要求M?= diag(r),評(píng)分函數(shù)如下:

DistMult優(yōu)點(diǎn)就是計(jì)算簡(jiǎn)單,成本低。但是因?yàn)槟P瓦^于簡(jiǎn)化,只能處理對(duì)稱關(guān)系。對(duì)于一般kg來說,它不夠強(qiáng)大。

Holographic Embeddings(HolE)

HolE結(jié)合了RESCAL的表達(dá)能力和DistMult的效率和簡(jiǎn)單性。它將實(shí)體和關(guān)系重新表示為R?中的向量。給定一個(gè)事實(shí)(h,r,t),通過使用循環(huán)相關(guān)操作,首先將實(shí)體表示組合成h*t∈r?:

采用*的主要目的是利用壓縮張量積形式的復(fù)合表示的降低復(fù)雜性。HolE利用了快速傅里葉變換,可以通過以下方式進(jìn)一步加速計(jì)算過程:

HolE每個(gè)關(guān)系只需要O(d)個(gè)參數(shù),這比RESCAL更有效。但是HolE不能對(duì)不對(duì)的稱關(guān)系建模,但在一些研究論文中,把它與擴(kuò)展形式HolEX混淆了,HolEX能夠處理不對(duì)稱關(guān)系。

Complex Embeddings (ComplEx)

Complex通過引入復(fù)值嵌入來擴(kuò)展DistMult,以便更好地建模非對(duì)稱關(guān)系。在ComplEx中,實(shí)體和關(guān)系嵌入h,r,t不再位于實(shí)空間中,而是位于復(fù)空間中,例如C?。

這個(gè)評(píng)分函數(shù)不再對(duì)稱,來自非對(duì)稱關(guān)系的事實(shí)可以根據(jù)所涉及實(shí)體的順序獲得不同的分?jǐn)?shù)。作為共軛對(duì)稱施加于嵌入的特殊情況,HolE可以被包含在ComplEx中。

ANALOGY

ANALOGY 擴(kuò)展了RESCAL,可以進(jìn)一步對(duì)實(shí)體和關(guān)系的類推屬性建模。它采用了雙線性評(píng)分函數(shù)。

DistMult, HolE和ComplEx都可以作為特殊情況在ANALOGY上實(shí)現(xiàn)。

以下是語義匹配模型的對(duì)比總結(jié):

Deep Scoring Functions

對(duì)于深度學(xué)習(xí)進(jìn)步,還出現(xiàn)了基于深度學(xué)習(xí)的評(píng)分函數(shù)

ConvE

ConvE是第一個(gè)使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來預(yù)測(cè)知識(shí)圖譜中缺失環(huán)節(jié)的模型之一。與完全連接的密集層不同,cnn可以通過使用很少的參數(shù)學(xué)習(xí)來幫助捕獲復(fù)雜的非線性關(guān)系。ConvE在多個(gè)維度上實(shí)現(xiàn)了不同實(shí)體之間的本地連接。

concat為連接運(yùn)算符,*表示卷積,e?和e?分別負(fù)責(zé)主題單元和關(guān)系單元的二維重塑。

ConvE不能捕獲三元嵌入的全局關(guān)系

ConvKB

ConbKB使用1D卷積來保留TransE的解釋屬性,捕獲實(shí)體之間的全局關(guān)系和時(shí)間屬性。該方法將每個(gè)三元網(wǎng)絡(luò)嵌入為三段網(wǎng)絡(luò),并將其饋送到卷積層,實(shí)現(xiàn)事實(shí)的維類之間的全局連接。

其中Ω(過濾器集),e(權(quán)重向量)表示共享參數(shù)。

HypER

HypER將每個(gè)關(guān)系的向量嵌入通過密集層投影后完全重塑,然后調(diào)整每層中的一堆卷積通道權(quán)重向量關(guān)系,這樣可以有更高的表達(dá)范圍和更少的參數(shù)。

vec是將一個(gè)向量重新塑造為一個(gè)矩陣,非線性f是ReLU。

模型的空間復(fù)雜度和時(shí)間復(fù)雜度的比較

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    知識(shí)圖譜相關(guān)應(yīng)用

    智慧風(fēng)控的背后,是知識(shí)圖譜的深度應(yīng)用
    發(fā)表于 08-22 14:40

    KGB知識(shí)圖譜基于傳統(tǒng)知識(shí)工程的突破分析

    知識(shí)圖譜本質(zhì)上是一種大規(guī)模的語義網(wǎng)絡(luò)。從2012年谷歌提出知識(shí)圖譜,知識(shí)圖譜一直在快速發(fā)展,其應(yīng)用也不再局限于“語義網(wǎng)絡(luò)”范疇?,F(xiàn)如今的知識(shí)圖譜在實(shí)際應(yīng)用中,主要作為大數(shù)據(jù)時(shí)代的
    發(fā)表于 10-22 15:25

    KGB知識(shí)圖譜技術(shù)能夠解決哪些行業(yè)痛點(diǎn)?

    的人力解決問題,這樣企業(yè)使用自動(dòng)化設(shè)備進(jìn)行知識(shí)獲取的方式也不能滿足其降低人力消耗的需求。在知識(shí)應(yīng)用層面,知識(shí)圖譜應(yīng)用于行業(yè)應(yīng)用中,針對(duì)其行業(yè)數(shù)據(jù),即使應(yīng)對(duì)數(shù)據(jù)量比較集中的情況,其
    發(fā)表于 10-30 15:34

    知識(shí)圖譜的三種特性評(píng)析

    的三個(gè)重要方面包括目標(biāo)的動(dòng)態(tài)性。比如根據(jù)已有的知識(shí)圖譜模型,能否一個(gè)在人工不干預(yù)的情況下,自動(dòng)識(shí)別出同類事物;當(dāng)一名影星再婚之后,是否可以在人工不干預(yù)的情況下,自動(dòng)識(shí)別他的新配偶。(2) 目標(biāo)的多樣化
    發(fā)表于 12-13 13:57

    KGB知識(shí)圖譜通過智能搜索提升金融行業(yè)分析能力

    的自然語言處理技術(shù),搭建專業(yè)領(lǐng)域深度知識(shí)圖譜,快速學(xué)習(xí)并迭代金融行業(yè)最新知識(shí),構(gòu)建一二級(jí)市場(chǎng)眾多實(shí)體模型,智能化的理解用戶的搜索請(qǐng)求,使得搜索更簡(jiǎn)單更準(zhǔn)確,滿足用戶找數(shù)據(jù)、找報(bào)告的需求。KGB
    發(fā)表于 06-22 21:23

    一種融合知識(shí)圖譜和協(xié)同過濾的混合推薦模型

    RCKC構(gòu)成。RCKD模型在獲取知識(shí)圖譜的推理路徑后,利用 Transe算法將路徑嵌入為向量,并使用LSTM和soft attention機(jī)制捕獲路徑推理的語義,通過池化操作區(qū)分不同路徑推理的重要性,經(jīng)全連接層和 sigmoid
    發(fā)表于 03-16 14:37 ?10次下載
    一種融合<b class='flag-5'>知識(shí)圖譜</b>和協(xié)同過濾的混合推薦<b class='flag-5'>模型</b>

    知識(shí)圖譜劃分的相關(guān)算法及研究

    知識(shí)圖譜是人工智能的重要基石,因其包含豐富的圖結(jié)構(gòu)和屬性信息而受到廣泛關(guān)注。知識(shí)圖譜可以精確語義描述現(xiàn)實(shí)世界中的各種實(shí)體及其聯(lián)系,其中頂點(diǎn)表示實(shí)體,邊表示實(shí)體間的聯(lián)系。知識(shí)圖譜劃分是大規(guī)模知識(shí)
    發(fā)表于 03-18 10:10 ?9次下載
    <b class='flag-5'>知識(shí)圖譜</b>劃分的相關(guān)算法及研究

    知識(shí)圖譜與訓(xùn)練模型相結(jié)合和命名實(shí)體識(shí)別的研究工作

    本次將分享ICLR2021中的三篇投遞文章,涉及知識(shí)圖譜與訓(xùn)練模型相結(jié)合和命名實(shí)體識(shí)別(NER)的研究工作。 文章概覽 知識(shí)圖譜和語言理解的聯(lián)合預(yù)訓(xùn)練(JAKET: Joint
    的頭像 發(fā)表于 03-29 17:06 ?4135次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>與訓(xùn)練<b class='flag-5'>模型</b>相結(jié)合和命名實(shí)體識(shí)別的研究工作

    Fudan DISC實(shí)驗(yàn)室將分享三篇關(guān)于知識(shí)圖譜嵌入模型的論文

    知識(shí)圖譜嵌入 knowledge graph embedding是將包含實(shí)體和關(guān)系的知識(shí)圖譜三元組嵌入到高維向量空間中,獲得實(shí)體和關(guān)系的數(shù)值表示,提取圖中相關(guān)信息,并進(jìn)行后續(xù)運(yùn)算推斷
    的頭像 發(fā)表于 04-15 14:14 ?2747次閱讀
    Fudan DISC實(shí)驗(yàn)室將分享三篇關(guān)于<b class='flag-5'>知識(shí)圖譜</b><b class='flag-5'>嵌入</b><b class='flag-5'>模型</b>的論文

    規(guī)則引導(dǎo)的知識(shí)圖譜聯(lián)合嵌入方法

    的向量空間中.且所學(xué)習(xí)到的嵌入表示已被成功用于緩解大規(guī)模知識(shí)圖譜的計(jì)算效率低下問題.然而,大多數(shù)現(xiàn)有嵌入學(xué)習(xí)模型僅考慮知識(shí)圖譜的結(jié)構(gòu)信息.
    發(fā)表于 12-28 10:42 ?690次閱讀

    知識(shí)圖譜嵌入的Translate模型匯總(TransE,TransH,TransR,TransD)

    作者:Xu LIANG編譯:ronghuaiyang 首發(fā):AI公園公眾號(hào)導(dǎo)讀一文打盡圖嵌入Translate模型,各種模型的動(dòng)機(jī),優(yōu)缺點(diǎn)分析。本文對(duì)知識(shí)圖譜...
    發(fā)表于 01-26 19:54 ?6次下載
    <b class='flag-5'>知識(shí)圖譜</b><b class='flag-5'>嵌入</b>的Translate<b class='flag-5'>模型</b>匯總(TransE,TransH,TransR,TransD)

    知識(shí)圖譜Knowledge Graph構(gòu)建與應(yīng)用

    一、知識(shí)圖譜概論 ? ? ? ? 1.1知識(shí)圖譜的起源和歷史 1.2知識(shí)圖譜的發(fā)展史——從框架、本體論、語義網(wǎng)、鏈接數(shù)據(jù)到知識(shí)圖譜 1.3知識(shí)圖譜
    發(fā)表于 09-17 10:12 ?579次閱讀

    知識(shí)圖譜知識(shí)圖譜的典型應(yīng)用

    作者:?cooldream2009? 我們構(gòu)建知識(shí)圖譜的目的,在于利用知識(shí)圖譜來做一些事情。有效利用知識(shí)圖譜,就是要考慮知識(shí)圖譜的具備的能力,知識(shí)圖
    的頭像 發(fā)表于 10-18 09:26 ?1582次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>:<b class='flag-5'>知識(shí)圖譜</b>的典型應(yīng)用

    知識(shí)圖譜與大模型結(jié)合方法概述

    本文作者 |? 黃巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》總結(jié)了大語言模型知識(shí)圖譜融合的三種路線:1
    的頭像 發(fā)表于 10-29 15:50 ?831次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>與大<b class='flag-5'>模型</b>結(jié)合方法概述

    知識(shí)圖譜與大模型之間的關(guān)系

    在人工智能的廣闊領(lǐng)域中,知識(shí)圖譜與大模型是兩個(gè)至關(guān)重要的概念,它們各自擁有獨(dú)特的優(yōu)勢(shì)和應(yīng)用場(chǎng)景,同時(shí)又相互補(bǔ)充,共同推動(dòng)著人工智能技術(shù)的發(fā)展。本文將從定義、特點(diǎn)、應(yīng)用及相互關(guān)系等方面深入探討知識(shí)圖譜與大
    的頭像 發(fā)表于 07-10 11:39 ?622次閱讀