0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LinkedIn圖數(shù)據(jù)庫 LIquid:為9.3億會(huì)員提供實(shí)時(shí)數(shù)據(jù)訪問

jf_WZTOguxH ? 來源:AI前線 ? 2023-07-13 14:22 ? 次閱讀

最近,LinkedIn 分享了其圖數(shù)據(jù)庫 LIquid 是如何自動(dòng)索引和實(shí)時(shí)訪問會(huì)員、學(xué)校、技能、公司、職位、工作、事件等之間的關(guān)系數(shù)據(jù)的。這個(gè)知識圖譜被稱為 LinkedIn 的“Economic Graph”,有 2700 億條邊,并且還在不斷增長,目前每秒處理 200 萬次查詢。

LinkedIn 將其“你可能認(rèn)識的人(People You May Know,PYMK)”推薦系統(tǒng)從傳統(tǒng)的 GAIA 系統(tǒng)遷移到了 LIquid。這一變化顯著改善了每秒查詢數(shù)(QPS)、延遲和 CPU 利用率。QPS 從 120 增加到 18000,延遲從超過 15 秒下降到平均 50 毫秒以下,CPU 利用率下降了 3 倍以上。LIquid 還引入了新的數(shù)據(jù)庫索引技術(shù),支持實(shí)時(shí)數(shù)據(jù)查詢,實(shí)現(xiàn)了即時(shí)推薦。

3dad1186-213f-11ee-962d-dac502259ad0.jpg

圖片來源:https://engineering.linkedin.com/blog/2023/how-liquid-connects-everything-so-our-members-can-do-anything

上圖是系統(tǒng)的架構(gòu)圖,使用了 LIquid,可以以較小的延遲和可接受的硬件成本來執(zhí)行圖查詢。通過 LIquid 對 Economic Graph 的查詢生成數(shù)百個(gè)候選對象,并應(yīng)用第二個(gè)排名函數(shù)。這個(gè)排名函數(shù)使用 Venice 的機(jī)器學(xué)習(xí)功能和 Apache Pinot 的分析見解來評分并選擇最佳候選對象。過濾步驟為呈現(xiàn)和最終評分準(zhǔn)備好了這個(gè)排名列表。

LIquid 的設(shè)計(jì)使其能夠伸縮到當(dāng)前十倍的規(guī)模,可以支持 LinkedIn 9.3 億多會(huì)員的有機(jī)增長和新的語義領(lǐng)域。它提供 99.99% 的可用性,并可以自動(dòng)根據(jù)圖的大小和活動(dòng)量的增加進(jìn)行自動(dòng)伸縮。

圖數(shù)據(jù)庫使用基于 Datalog 的可組合聲明式查詢語言,幫助開發(fā)人員高效地訪問和使用數(shù)據(jù)??山M合語言能夠讓開發(fā)人員在現(xiàn)有的特性(叫作模塊)上進(jìn)行構(gòu)建,聲明式語言能夠讓開發(fā)人員專注于表達(dá)他們想要開發(fā)的東西,而 LIquid 自動(dòng)化了高效的訪問過程。開發(fā)人員因此可以快速變更數(shù)據(jù)集,大大減少了調(diào)整和更新數(shù)據(jù)庫所需的時(shí)間。

LinkedIn 工程總監(jiān) Bogdan Artintescu 描述了 LIquid 的發(fā)展路線圖:

要讓會(huì)員能夠做更多的事情,我們需要在回答會(huì)員的問題方面提供更加完善的能力。我們可以沿著兩個(gè)方向做出改進(jìn)。首先,復(fù)雜的查詢和添加到 Economic Graph 的數(shù)據(jù)源的多樣性將會(huì)驅(qū)動(dòng)新特性的開發(fā)和呈現(xiàn)。其次,豐富數(shù)據(jù)將提高推理能力。這可以通過創(chuàng)建派生數(shù)據(jù)(通過確定性算法或概率機(jī)器學(xué)習(xí)方法)或通過知識圖譜(KG)模式中更豐富的語義改進(jìn)推理來實(shí)現(xiàn)。我們計(jì)劃專注于高性能圖形計(jì)算和分析,并建立一個(gè) KG 生態(tài)系統(tǒng),讓我們的開發(fā)人員能夠進(jìn)一步增強(qiáng)會(huì)員體驗(yàn)。

LIquid 的成功激勵(lì)了 LinkedIn 的其他團(tuán)隊(duì)和微軟的姐妹團(tuán)隊(duì)將它作為圖數(shù)據(jù)索引。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:LinkedIn 圖數(shù)據(jù)庫 LIquid:為 9.3 億會(huì)員提供實(shí)時(shí)數(shù)據(jù)訪問

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯(cuò)誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?139次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯(cuò)誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SqlServer數(shù)據(jù)庫底層File Record被截?cái)?b class='flag-5'>為0的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫數(shù)據(jù)無法被讀取。 經(jīng)過數(shù)據(jù)庫數(shù)據(jù)恢復(fù)工程師的初步檢測,發(fā)現(xiàn)SQL Server數(shù)據(jù)庫文件無法被讀取的原因是底層
    的頭像 發(fā)表于 07-26 11:27 ?254次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SqlServer<b class='flag-5'>數(shù)據(jù)庫</b>底層File Record被截?cái)?b class='flag-5'>為</b>0的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】Oracle數(shù)據(jù)庫ASM實(shí)例無法掛載的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫ASM磁盤組掉線,ASM實(shí)例不能掛載。數(shù)據(jù)庫管理員嘗試修復(fù)數(shù)據(jù)庫,但是沒有成功。
    的頭像 發(fā)表于 02-01 17:39 ?376次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】Oracle<b class='flag-5'>數(shù)據(jù)庫</b>ASM實(shí)例無法掛載的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    應(yīng)用方案:實(shí)時(shí)數(shù)據(jù)加密

    應(yīng)用方案:實(shí)時(shí)數(shù)據(jù)加密 利用CPLD設(shè)計(jì)加密電路方便可行,能夠較好地實(shí)現(xiàn)加密功能。AG32系列MCU產(chǎn)品,在芯片內(nèi)部內(nèi)置了CPLD邏輯,可以有效地滿足各種數(shù)據(jù)采集需求,降低了客戶的BOM成本。以下
    發(fā)表于 01-15 08:57

    虹科干貨丨無模式數(shù)據(jù)庫的利與弊

    數(shù)據(jù)管理需求日益多樣,無論是金融服務(wù)、游戲還是社交媒體行業(yè),都要求支持實(shí)時(shí)數(shù)據(jù)處理和快速迭代,無模式數(shù)據(jù)庫因其靈活性和易用性而逐漸成為開發(fā)者的新選擇。那么,無模式數(shù)據(jù)庫到底有哪些特性呢
    的頭像 發(fā)表于 12-20 09:44 ?276次閱讀

    無模式數(shù)據(jù)庫的利與弊

    數(shù)據(jù)管理需求日益多樣,無論是金融服務(wù)、游戲還是社交媒體行業(yè),都要求支持實(shí)時(shí)數(shù)據(jù)處理和快速迭代,無模式數(shù)據(jù)庫因其靈活性和易用性而逐漸成為開發(fā)者的新選擇。那么,無模式數(shù)據(jù)庫到底有哪些特性呢
    的頭像 發(fā)表于 12-16 08:04 ?388次閱讀
    無模式<b class='flag-5'>數(shù)據(jù)庫</b>的利與弊

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—未開啟binlog的Mysql數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 本地服務(wù)器,windows server操作系統(tǒng) ,部署有mysql單實(shí)例,數(shù)據(jù)庫引擎類型innodb,獨(dú)立表空間,無
    的頭像 發(fā)表于 12-08 14:18 ?943次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—未開啟binlog的Mysql<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    常見的存儲Idea數(shù)據(jù)庫的地方

    。它們使用表格和行的結(jié)構(gòu)來組織數(shù)據(jù),并使用SQL語言來查詢和管理數(shù)據(jù)。一些著名的關(guān)系型數(shù)據(jù)庫包括MySQL,Oracle,Microsoft SQL Server和PostgreSQL等。這些
    的頭像 發(fā)表于 12-06 14:15 ?805次閱讀

    聊聊日志即數(shù)據(jù)庫

    數(shù)據(jù)庫故障恢復(fù)機(jī)制的前世今生》[1]一文中介紹過,由于磁盤的的順序訪問性能遠(yuǎn)好于隨機(jī)訪問,數(shù)據(jù)庫設(shè)計(jì)中通常都會(huì)采用WAL的方式,將隨機(jī)訪問
    的頭像 發(fā)表于 12-06 09:30 ?549次閱讀
    聊聊日志即<b class='flag-5'>數(shù)據(jù)庫</b>

    oracle數(shù)據(jù)庫中間件有哪些

    Oracle數(shù)據(jù)庫中間件是指由Oracle公司開發(fā)和提供的一系列軟件產(chǎn)品,用于構(gòu)建、部署和管理企業(yè)級應(yīng)用。它提供了一套完整的解決方案,包括數(shù)據(jù)庫管理、應(yīng)用服務(wù)器、
    的頭像 發(fā)表于 12-05 16:17 ?1586次閱讀

    什么是JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運(yùn)作,它為應(yīng)用程序開發(fā)者帶來了哪些價(jià)值呢?文章速覽:什么是JSON什么是JSON
    的頭像 發(fā)表于 12-02 08:04 ?692次閱讀
    什么是JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    NoSQL 數(shù)據(jù)庫如何選型

    什么是NoSQL數(shù)據(jù)庫?為什么要使用NoSQL數(shù)據(jù)庫?鍵值數(shù)據(jù)庫內(nèi)存鍵值數(shù)據(jù)庫文檔數(shù)據(jù)庫列式數(shù)據(jù)庫
    的頭像 發(fā)表于 11-26 08:05 ?364次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型

    如何提高M(jìn)ysql數(shù)據(jù)庫訪問瓶頸

    為了提高M(jìn)ysql數(shù)據(jù)庫訪問瓶頸,常用的方法有如下兩個(gè): 在服務(wù)器端增加緩存服務(wù)器緩存常用的數(shù)據(jù)(例如redis) 增加連接池,來提高M(jìn)Ysql Server的訪問效率,在高并發(fā)的
    的頭像 發(fā)表于 11-08 16:22 ?936次閱讀
    如何提高M(jìn)ysql<b class='flag-5'>數(shù)據(jù)庫</b>的<b class='flag-5'>訪問</b>瓶頸

    Access數(shù)據(jù)庫案例:Labview數(shù)據(jù)存儲

     在數(shù)據(jù)庫領(lǐng)域,Access是由Microsoft開發(fā)的一款基于Windows平臺的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)。它提供了一個(gè)使用簡便的用戶界面,可用于創(chuàng)建、管理和查詢數(shù)據(jù)庫。
    發(fā)表于 10-26 16:23 ?9次下載

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)-oracle數(shù)據(jù)庫報(bào)錯(cuò)無法打開的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器,底層由12塊硬盤組成一組磁盤陣列,上層操作系統(tǒng)上運(yùn)行oracle數(shù)據(jù)庫。 oracle數(shù)據(jù)庫故障:
    的頭像 發(fā)表于 10-12 14:00 ?706次閱讀