0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何借助TigerGraph機(jī)器學(xué)習(xí)工作臺(tái)加速企業(yè)BI

TigerGraph ? 來(lái)源:TigerGraph ? 作者:TigerGraph ? 2022-11-29 10:24 ? 次閱讀

什么是圖數(shù)據(jù)庫(kù),為什么要關(guān)心圖?

做出正確的商業(yè)決策需要了解任何一個(gè)行動(dòng)或交易之間的關(guān)系,因?yàn)樗鼈儽舜讼嚓P(guān)。許多企業(yè)、數(shù)據(jù)分析公司和數(shù)據(jù)科學(xué)家正在尋找新的方法來(lái)探索連接和關(guān)系,看看我們的數(shù)據(jù)能給我們帶來(lái)什么額外的見(jiàn)解。

借助圖分析,我們認(rèn)識(shí)到,所有的數(shù)據(jù)其實(shí)都代表了現(xiàn)實(shí)世界中的一些東西,而現(xiàn)實(shí)世界中的幾乎所有東西都以某種方式聯(lián)系在一起。從關(guān)系中找到這些新的模式,可以用來(lái)為電子商務(wù)網(wǎng)站打造更好的產(chǎn)品推薦,使銀行在欺詐發(fā)生之前找到潛在欺詐者,或者讓制造企業(yè)找到提高供應(yīng)鏈效率的方法。

TigerGraph Cloud是業(yè)界首個(gè)也是唯一一個(gè)分布式原生圖數(shù)據(jù)庫(kù)即服務(wù),使用戶能夠更容易地加速采用圖,實(shí)時(shí)處理分析和事務(wù)性工作負(fù)載。通過(guò)最新的3.8版本,你還可以在TigerGraph Cloud上配置你的ML Workbench Jupyter notebook,為你的圖數(shù)據(jù)庫(kù)和圖機(jī)器學(xué)習(xí)開(kāi)發(fā)環(huán)境提供一站式體驗(yàn)。

案例:圖增強(qiáng)的ML模型檢測(cè)欺詐行為

世界各地的公司正在投資于圖,將其作為一種競(jìng)爭(zhēng)優(yōu)勢(shì)。圖算法和機(jī)器學(xué)習(xí)領(lǐng)域的研究表明,通過(guò)將數(shù)據(jù)構(gòu)建在一個(gè)固有的捕捉上下文和關(guān)系的圖結(jié)構(gòu)中,可以大大改善預(yù)測(cè)模型的質(zhì)量。特別是在欺詐領(lǐng)域,圖增強(qiáng)的機(jī)器學(xué)習(xí)模型可以學(xué)習(xí)欺詐交易和行為人之間的潛在關(guān)系模式,而傳統(tǒng)的ML方法(如XGBoost模型)則無(wú)法捕捉。

在這篇博客中,我們將探討如何應(yīng)用圖算法和圖特征來(lái)解決欺詐檢測(cè)問(wèn)題。我們將展示如何用TigerGraph構(gòu)建你的圖數(shù)據(jù)集,然后我們將通過(guò)一個(gè)Jupyter notebook的例子,用GNN模型構(gòu)建一個(gè)端到端的欺詐檢測(cè)應(yīng)用程序,使用Ethereum數(shù)據(jù)集,其中包含賬戶(有正面和負(fù)面標(biāo)簽)和它們之間的交易。下面是schema的樣子:

8e7f0058-6f8b-11ed-8abf-dac502259ad0.png

在TigerGraph Cloud上構(gòu)建你的圖

在任何模型開(kāi)發(fā)之前,我們首先需要構(gòu)建你的圖。在這個(gè)例子中,我們將使用TigerGraph Cloud的免費(fèi)版本,這是業(yè)界第一個(gè)也是唯一一個(gè)原生并行圖數(shù)據(jù)庫(kù)即服務(wù)。

要開(kāi)始使用TigerGraph數(shù)據(jù)庫(kù)集群,你只需要通過(guò)選擇硬件配置來(lái)完成集群配置過(guò)程。

8f947d10-6f8b-11ed-8abf-dac502259ad0.png

在高級(jí)設(shè)置部分,確保啟用機(jī)器學(xué)習(xí)工作臺(tái),然后在入門(mén)套件中選擇圖機(jī)器學(xué)習(xí),這樣它就包括在你的配置集群中。(注意:對(duì)于這個(gè)版本,我們將只支持單服務(wù)器配置,即分區(qū)因子=1)

8fb896c8-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph云上的機(jī)器學(xué)習(xí)工作臺(tái)

TigerGraph云上的機(jī)器學(xué)習(xí)工作臺(tái)

一旦你的圖數(shù)據(jù)庫(kù)被配置好了,你將需要添加一個(gè)用戶和密碼,以便用機(jī)器學(xué)習(xí)工作臺(tái)連接到數(shù)據(jù)庫(kù)。只需從左邊的 “Clusters “選項(xiàng)卡上點(diǎn)擊你剛剛配置的集群的 Access Management”,然后用你的憑證點(diǎn)擊 “Add User”。

8ff2a732-6f8b-11ed-8abf-dac502259ad0.png

一旦你添加了一個(gè)用戶,你現(xiàn)在可以直接利用機(jī)器學(xué)習(xí)工作臺(tái),點(diǎn)擊左側(cè)面板上的集群,然后點(diǎn)擊”Tools” 》 “Machine Learning Workbench”。

901648fe-6f8b-11ed-8abf-dac502259ad0.png

一個(gè)新的瀏覽器窗口將被打開(kāi),你將登陸到機(jī)器學(xué)習(xí)工作臺(tái)的Jupyter服務(wù)器。

903b76ce-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph 機(jī)器學(xué)習(xí)工作臺(tái)有很多很好的教程,包括如何使用pyTigerGraph使用我們的ML功能的例子,運(yùn)行我們圖數(shù)據(jù)科學(xué)庫(kù)的算法,以及端到端的應(yīng)用。
你可能已經(jīng)聽(tīng)說(shuō)了最近在人工智能/ML方面的圖譜神經(jīng)網(wǎng)絡(luò)的突破。在這篇博客中,我們將展示利用我們內(nèi)置的python功能(如圖數(shù)據(jù)分區(qū)、數(shù)據(jù)導(dǎo)出/批處理和圖特征工程)建立一個(gè)GNN模型是多么容易。該notebook 可以在下面路徑找到:GML→ Applications → Fraud_Detection → Fraud_Detection.ipynb.

907382da-6f8b-11ed-8abf-dac502259ad0.png

在運(yùn)行任何代碼之前,你首先需要確保config.json中的用戶名和密碼(在Jupyter服務(wù)器的root文件夾中)被相應(yīng)地更新為你剛剛從tgcloud.io創(chuàng)建的新用戶。

909a23d6-6f8b-11ed-8abf-dac502259ad0.png

準(zhǔn)備你的圖數(shù)據(jù)集

現(xiàn)在,我們已經(jīng)準(zhǔn)備好與TigerGraph云數(shù)據(jù)庫(kù)實(shí)例建立連接,只需運(yùn)行以下代碼,并將Ethereum 數(shù)據(jù)集導(dǎo)入到你的實(shí)例。

90d5dee4-6f8b-11ed-8abf-dac502259ad0.png

圖特征工程

像任何其他監(jiān)督下的機(jī)器學(xué)習(xí)模型一樣,GNN需要訓(xùn)練、驗(yàn)證和測(cè)試集來(lái)開(kāi)發(fā)模型。ML Workbench通過(guò)一個(gè)簡(jiǎn)單的命令使數(shù)據(jù)分區(qū)變得簡(jiǎn)單。我們將對(duì)你的圖數(shù)據(jù)進(jìn)行分區(qū),同時(shí)保留你的數(shù)據(jù)集的關(guān)系。

910da70c-6f8b-11ed-8abf-dac502259ad0.png

ML workbench 包括TIgerGraph的圖數(shù)據(jù)科學(xué)庫(kù)中的相當(dāng)多的圖算法來(lái)進(jìn)行特征工程。這個(gè)notebook 所強(qiáng)調(diào)的關(guān)鍵功能是:

listAlgorithm():如果你輸入算法的類(lèi)別(如中心性),它將打印指定類(lèi)別的可用算法;否則它將打印所有可用的算法類(lèi)別。

installAlgorithm():獲取算法的名稱(chēng)作為輸入,如果該算法尚未安裝,則安裝該算法。

runAlgorithm():獲取算法名稱(chēng)和參數(shù)以運(yùn)行該算法。如果該算法尚未安裝,并且存在于TigerGraph的圖數(shù)據(jù)科學(xué)庫(kù)中,該算法將自動(dòng)安裝查詢語(yǔ)句,并在圖中創(chuàng)建必要的schema屬性。

下面的代碼顯示了如何使用Featurizer來(lái)獲得PageRank作為一個(gè)特征。你也可以通過(guò)運(yùn)行你自己的GSQL查詢語(yǔ)句,并通過(guò)Featurizer運(yùn)行它,來(lái)定義你自己的自定義特征。

912e2022-6f8b-11ed-8abf-dac502259ad0.png

現(xiàn)在我們已經(jīng)完成了特征工程,下一步是使用我們的Neighbor Loader函數(shù)導(dǎo)出你的訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集。你可以用我們的Neighbor Loader函數(shù)定義你的采樣策略,如批次大小、跳數(shù)和鄰居數(shù)。

914298ea-6f8b-11ed-8abf-dac502259ad0.png

訓(xùn)練你的GNN模型

現(xiàn)在,我們已經(jīng)完成了圖特征工程,并將所有的數(shù)據(jù)導(dǎo)出到你的機(jī)器學(xué)習(xí)工作臺(tái)環(huán)境,以訓(xùn)練機(jī)器學(xué)習(xí)模型。


我們擁護(hù)開(kāi)源社區(qū),這就是為什么我們把TigerGraph ML Workbench與一些最流行的深度學(xué)習(xí)框架兼容,如PyTorch Geometric和Tensorflow。注意在上面的代碼中,我們直接將你的關(guān)聯(lián)數(shù)據(jù)以output_format參數(shù)中指定的PyG格式導(dǎo)出,你將能夠直接利用PyG來(lái)訓(xùn)練一個(gè)GNN模型,比如Graph Attention Network( (GATs)算法。請(qǐng)看下面的例子:

91808f38-6f8b-11ed-8abf-dac502259ad0.png

一旦你的模型訓(xùn)練完成,你就可以對(duì)你的模型進(jìn)行推理,看看一個(gè)欺詐者是如何通過(guò)其網(wǎng)絡(luò)移動(dòng)交易的。為了更好地解釋預(yù)測(cè)行為,我們可以將與預(yù)測(cè)頂點(diǎn)相關(guān)的子圖可視化。

用子圖可視化你的模型預(yù)測(cè)

在這個(gè)例子中,頂點(diǎn)#1891被預(yù)測(cè)為一個(gè)欺詐賬戶。粉紅色的頂點(diǎn)是已知的欺詐賬戶,用藍(lán)色標(biāo)識(shí)的頂點(diǎn)是未知賬戶??雌饋?lái)頂點(diǎn)1891是一個(gè)欺詐者網(wǎng)絡(luò)的幕后策劃者,一直在從無(wú)辜的用戶那里拿錢(qián)!

91c32d5c-6f8b-11ed-8abf-dac502259ad0.png

下一步

如果你覺(jué)得這篇文章很有趣,并想建立自己的GNN應(yīng)用程序,請(qǐng)免費(fèi)試用我們的TigerGraph Cloud和TigerGraph ML Workbench。請(qǐng)從我們的Github(https://github.com/tigergraph/graph-ml-notebooks)上查看我們的教程。你也可以在這篇博文中找到我們所用到的notebook例子的鏈接。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:如何借助TigerGraph機(jī)器學(xué)習(xí)工作臺(tái)加速企業(yè)BI

文章出處:【微信號(hào):TigerGraph,微信公眾號(hào):TigerGraph】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級(jí)安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開(kāi)發(fā)者均可充分利用高計(jì)算密度的優(yōu)勢(shì)來(lái)加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計(jì)
    的頭像 發(fā)表于 09-18 09:16 ?138次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    Cloudera推出機(jī)器學(xué)習(xí)項(xiàng)目加速器 (AMP) 的全新套件

    / --?Cloudera是唯一真正意義上的數(shù)據(jù)、分析和人工智能混合平臺(tái),該平臺(tái)今天宣布推出多款全新機(jī)器學(xué)習(xí)項(xiàng)目加速器 (AMP) ,旨在縮短企業(yè)人工智能用例的價(jià)值實(shí)現(xiàn)時(shí)間。 新增功能
    的頭像 發(fā)表于 09-13 14:51 ?101次閱讀

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來(lái)?

    設(shè)備的運(yùn)行狀況,生成各種維度的報(bào)告。 同時(shí),通過(guò)大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),可以對(duì)業(yè)務(wù)進(jìn)行預(yù)測(cè)和預(yù)警,從而協(xié)助社會(huì)和企業(yè)進(jìn)行科學(xué)決策、降低成本并創(chuàng)造新的價(jià)值。 當(dāng)今時(shí)代,數(shù)據(jù)無(wú)處不在,而時(shí)間序列數(shù)據(jù)更是
    發(fā)表于 06-25 15:00

    虹軟PhotoStudio AI正式入駐阿里巴巴集團(tuán)旗下的千牛商家工作臺(tái)

    5月8日,虹軟PhotoStudio? AI (簡(jiǎn)稱(chēng)PSAI)正式入駐阿里巴巴集團(tuán)旗下的千牛商家工作臺(tái),為廣大淘寶賣(mài)家、天貓商家提供更直接、便捷、高效的圖像生成與處理解決方案。
    的頭像 發(fā)表于 05-09 09:43 ?548次閱讀

    工作臺(tái)激光焊接機(jī)X, Y, Z,三軸功能的區(qū)別與作用

    編輯:鐳拓激光工作臺(tái)激光焊接機(jī)的X、Y、Z三軸功它們共同協(xié)作以實(shí)現(xiàn)高效、精準(zhǔn)的焊接。三軸的功能與作用具體如下:X軸:通常負(fù)責(zé)左右橫向移動(dòng),使得焊接頭可以在水平面上沿著工件的寬度方向進(jìn)行定位和移動(dòng)。Y
    的頭像 發(fā)表于 03-28 11:30 ?826次閱讀
    <b class='flag-5'>工作臺(tái)</b>激光焊接機(jī)X, Y, Z,三軸功能的區(qū)別與作用

    Domo與Tableau和Power BI?前Tableau工程師建議最大化BI工具潛能

    作為一名解決方案工程師,TannerBrockbank曾在兩家流行商業(yè)智能(BI)公司工作:Tableau和Domo。在他的職業(yè)生涯中,使用過(guò)許多BI工具。他發(fā)現(xiàn)部分組織選擇使用兩種BI
    的頭像 發(fā)表于 03-28 08:04 ?324次閱讀
    Domo與Tableau和Power <b class='flag-5'>BI</b>?前Tableau工程師建議最大化<b class='flag-5'>BI</b>工具潛能

    三軸工作臺(tái)激光焊接機(jī):實(shí)現(xiàn)高精度、高效率焊接的新選擇

    三軸工作臺(tái)激光焊接機(jī)是一種先進(jìn)的焊接設(shè)備,結(jié)合了激光焊接技術(shù)與三軸工作臺(tái)的運(yùn)動(dòng)控制,實(shí)現(xiàn)了焊接過(guò)程的高效、精準(zhǔn)與自動(dòng)化。這種設(shè)備主要利用激光束的高能量密度和高速度特性,使工件在熔化的同時(shí)快速冷卻凝固
    的頭像 發(fā)表于 03-27 19:32 ?273次閱讀
    三軸<b class='flag-5'>工作臺(tái)</b>激光焊接機(jī):實(shí)現(xiàn)高精度、高效率焊接的新選擇

    NVIDIA Isaac機(jī)器人平臺(tái)升級(jí),加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過(guò)引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、AI
    的頭像 發(fā)表于 03-27 10:36 ?502次閱讀

    數(shù)據(jù)中臺(tái):如何構(gòu)建企業(yè)核心競(jìng)爭(zhēng)力

    在當(dāng)今信息化快速發(fā)展的商業(yè)環(huán)境下,“數(shù)據(jù)中臺(tái)”已經(jīng)成為構(gòu)建企業(yè)核心競(jìng)爭(zhēng)力的關(guān)鍵步驟。數(shù)據(jù)中臺(tái)不僅是數(shù)據(jù)集成與管理的平臺(tái),更是企業(yè)智能化轉(zhuǎn)型的加速
    的頭像 發(fā)表于 03-22 16:28 ?295次閱讀
    數(shù)據(jù)中<b class='flag-5'>臺(tái)</b>:如何構(gòu)建<b class='flag-5'>企業(yè)</b>核心競(jìng)爭(zhēng)力

    傲穎-超凈工作臺(tái)-性能穩(wěn)定

    儀器儀表工作臺(tái)
    jf_12990097
    發(fā)布于 :2024年01月31日 16:15:13

    乾元-超凈工作臺(tái)-視頻解說(shuō)

    儀器儀表工作臺(tái)
    jf_91458691
    發(fā)布于 :2024年01月31日 16:12:56

    交叉導(dǎo)軌在光學(xué)工作臺(tái)起什么重要作用?

    交叉導(dǎo)軌在光學(xué)工作臺(tái)起什么重要作用?
    的頭像 發(fā)表于 11-24 17:55 ?493次閱讀
    交叉導(dǎo)軌在光學(xué)<b class='flag-5'>工作臺(tái)</b>起什么重要作用?

    基于單片機(jī)控制的數(shù)控X-Y工作臺(tái)系統(tǒng)設(shè)計(jì)

    本設(shè)計(jì)研究的課題主要是基于單片機(jī)控制的數(shù)控X-Y工作臺(tái)系統(tǒng)設(shè)計(jì)—插補(bǔ)部分設(shè)計(jì)。在系統(tǒng)程序設(shè)計(jì)上運(yùn)用逐點(diǎn)比較法使步進(jìn)電機(jī)實(shí)現(xiàn)單坐標(biāo)定位、兩坐標(biāo)直線插補(bǔ)和圓弧插補(bǔ)的基本功能。
    發(fā)表于 10-19 16:16 ?1次下載
    基于單片機(jī)控制的數(shù)控X-Y<b class='flag-5'>工作臺(tái)</b>系統(tǒng)設(shè)計(jì)

    TigerGraph 108TB LDBC基準(zhǔn)測(cè)試分析

    軟件方面,和36TB一樣,這次108TB基準(zhǔn)測(cè)試,我們沿用了TigerGraph 3.7.0企業(yè)版本。硬件成本從$281.27/hr增加到$843/hr,使用了72臺(tái)由第三代 AMD EPYC 處理器提供支持的AWS r6a.4
    發(fā)表于 10-17 15:56 ?296次閱讀
    <b class='flag-5'>TigerGraph</b> 108TB LDBC基準(zhǔn)測(cè)試分析

    轉(zhuǎn)塔式貼片機(jī)結(jié)構(gòu)特點(diǎn)

    線路板由上端傳送軌道送入機(jī)器的載入軌道,再送入工作臺(tái)工作臺(tái)進(jìn)行X、y方向的移動(dòng)從而實(shí)現(xiàn)不同坐標(biāo)元件的貼裝。當(dāng)元件貼裝完畢后,線路板由工作臺(tái)送至送出軌道和下端傳送軌道。一般線路板在載入
    發(fā)表于 09-26 15:30 ?616次閱讀
    轉(zhuǎn)塔式貼片機(jī)結(jié)構(gòu)特點(diǎn)