0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知識圖譜:技術(shù)成熟度飛速躍升,與產(chǎn)業(yè)互聯(lián)結(jié)合更加緊密

恬靜簡樸1 ? 來源:恬靜簡樸1 ? 作者:恬靜簡樸1 ? 2022-11-07 15:17 ? 次閱讀

國雙數(shù)據(jù)科學(xué)團隊劉燕

對比 2020 和 2019 年 Gartner 發(fā)布的人工智能領(lǐng)域的技術(shù)“成熟度曲線”(Hype Cycle),在短短 1 年時間,知識圖譜的成熟度由創(chuàng)新觸發(fā)階段一躍達到預(yù)期膨脹高峰階段且非常接近最高點。

知識圖譜逐漸成為人工智能應(yīng)用的強大助力。

曲線表示,知識圖譜的發(fā)展還需要5 - 10 年時間才能到達成熟的階段,知識圖譜依然有很大的發(fā)展空間。

pYYBAGNosPmAOhmVAAaxWdRyoCU795.png

pYYBAGNosP2Aa9NBAAbi-bp9S2A487.png

本文將從知識抽取、知識融合、知識推理的角度探索過去一年知識圖譜在自動構(gòu)建領(lǐng)域的技術(shù)突破,并結(jié)合圖機器學(xué)習(xí)、圖數(shù)據(jù)庫探討相關(guān)領(lǐng)域的技術(shù)發(fā)展。

而在應(yīng)用上,知識圖譜在 2020 年與產(chǎn)業(yè)互聯(lián)的結(jié)合更加緊密,除了在數(shù)據(jù)治理、搜索與推薦、問答等通用領(lǐng)域有所突破之外,在智能生產(chǎn)、智慧城市、智能管理、智能運維等眾多領(lǐng)域,以及工業(yè)、金融、司法、公安、醫(yī)療、教育等眾多行業(yè)也都有進一步的場景化落地的突破。

一、重要的技術(shù)發(fā)展

知識圖譜構(gòu)建

2020 年,利用自然語言處理、機器學(xué)習(xí)等技術(shù)從多源異構(gòu)的數(shù)據(jù)資源中自動構(gòu)建知識圖譜的技術(shù)取得長足進展。

主要涉及到兩種方法:一種是基于語言規(guī)則的方法,另一種是基于統(tǒng)計分析的機器學(xué)習(xí)方法。自動構(gòu)建的過程中,如果數(shù)據(jù)是結(jié)構(gòu)化的 ( 例如圖表數(shù)據(jù) ),已知屬性名稱、屬性間的層次結(jié)構(gòu)等,構(gòu)建知識圖譜相對較為容易。

如果缺乏以上信息,則只能通過文本信息等非結(jié)構(gòu)化數(shù)據(jù)中提煉知識構(gòu)建知識圖譜,技術(shù)上將面臨很多挑戰(zhàn)。

下面,我們從知識抽取、知識融合、知識推理這三方面來說明。

1.知識抽取

2020 年以來,更多知識抽取的研究工作被用來支撐更加復(fù)雜的應(yīng)用場景。多學(xué)科多領(lǐng)域交叉研究成為一個新的特點。小樣本學(xué)習(xí)在業(yè)界逐漸為人所關(guān)注。整體來看呈現(xiàn)以下趨勢:

(1)多模態(tài)(Multimodal)。

多模態(tài)并非 2020 年提出的新概念,但是 2020 年對于多模態(tài)的研究熱度較往年相比提升了很多。

目前 NLP 領(lǐng)域多模態(tài)研究主要集中在跨語言和視覺的模態(tài)研究上,且多模態(tài)知識圖譜也逐步成為一個新的趨勢。多模態(tài)研究包括多模態(tài)信息對齊,多模態(tài)文本生成,多模態(tài)推理,多模態(tài)表示,基于語言的視覺導(dǎo)航等。

多模態(tài)研究的基礎(chǔ)是模態(tài)融合和語義對齊,現(xiàn)在有很多工作研究從圖片或文本中提取出結(jié)構(gòu)化的知識,進行語義對齊。

目前多模態(tài)的相關(guān)研究還處于起步階段,什么場景使用以及如何使用還需要進一步探索。

(2)任務(wù)復(fù)雜化(Task complexity)。

2020 年以來,知識抽取任務(wù)更貼合實際應(yīng)用場景,復(fù)雜化的知識抽取任務(wù)向我們提出了新的挑戰(zhàn)。

關(guān)系抽取任務(wù)已不滿足于抽取封閉的三元組關(guān)系,而更貼合實際情況,出現(xiàn)了很多復(fù)雜關(guān)系和開放關(guān)系的抽取任務(wù)。例如,2020LIC 比賽中關(guān)系抽取賽題相比 2019 年增加了復(fù)雜關(guān)系抽??;部分關(guān)系抽取工作從句子級別向篇章級別和多文本抽取過渡;很多研究開始探索如何利用深度學(xué)習(xí)模型自動發(fā)現(xiàn)實體間的新型關(guān)系,實現(xiàn)開放關(guān)系抽取等。

對于常規(guī)的信息抽取任務(wù),已經(jīng)逐步往語義理解上轉(zhuǎn)變,并基于此衍生出很多閱讀理解和知識推理的任務(wù)。

在實體融合和指代消解等任務(wù)上的研究,場景也更為復(fù)雜,逐步向深層次語義理解和知識推理演變。

(3)零次學(xué)習(xí)(zero-shot learning)和小樣本學(xué)習(xí)(few-shot learning)。

Zero-shot 和 few-shot 一直是知識抽取研究的難點,2020 年對于 zero-shot 和 few-shot 有了更多深入的研究,包括利用集成學(xué)習(xí)、多任務(wù)學(xué)習(xí)、預(yù)訓(xùn)練模型、知識表示等方法結(jié)合深度學(xué)習(xí)模型進行的相關(guān)探索。

預(yù)訓(xùn)練模型的發(fā)展使得很多知識抽取工作的瓶頸下降,但是相對來說,領(lǐng)域遷移和冷啟動問題還是目前的難點。近幾年出現(xiàn)了很多結(jié)合知識圖譜進行知識表征,添加多模態(tài)信息,結(jié)合多領(lǐng)域進行多任務(wù)學(xué)習(xí)等融合多源知識的相關(guān)方法和研究,并取得了一定進展。

除此之外,多學(xué)科多領(lǐng)域交叉也是 NLP 和知識圖譜領(lǐng)域在 2020 年比較大的特點。例如知識表示,包括文本表示、圖表示、多模態(tài)表示之間的交叉和結(jié)合研究。

同時在知識抽取的多種任務(wù)中,都有多領(lǐng)域多學(xué)科結(jié)合相互指導(dǎo)優(yōu)化的發(fā)展趨勢,不同任務(wù),不同學(xué)科之間的邊界變得越來越模糊。

總的來說,2020 年是知識抽取研究飛速發(fā)展的一年,科學(xué)研究者們已經(jīng)不滿足于一些簡單的知識抽取任務(wù)的實現(xiàn),開始探索更貼合實際的應(yīng)用場景。對于任務(wù)的探索邊界也越來越不明顯,并出現(xiàn)了很多結(jié)合多源異構(gòu)信息的相關(guān)探索。除此之外,多模態(tài)和知識圖譜表征仍然有很大發(fā)展空間。

2.知識融合

知識融合方面一直以來都面臨兩個重要的技術(shù)挑戰(zhàn),一是數(shù)據(jù)規(guī)模的挑戰(zhàn),數(shù)據(jù)量大,種類多樣性,存儲位置不同、結(jié)構(gòu)不同;另一個是數(shù)據(jù)質(zhì)量的挑戰(zhàn),數(shù)據(jù)命名模糊,格式不同,數(shù)據(jù)缺失,噪音問題嚴重。

這兩個問題無論是以前,還是 2020 年度,一直都是知識融合方面面臨的嚴峻挑戰(zhàn)。

數(shù)據(jù)規(guī)模方面,行業(yè)算力的不斷提升使實用系統(tǒng)可以有效處理更大規(guī)模的圖譜數(shù)據(jù)。在多個知識圖譜聯(lián)合使用的知識融合方面,本年度 ACM SIGKDD 提出了 KGSF,通過互信息最大化,對齊不同圖譜中的語義空間,實現(xiàn)多知識圖譜的語義融合。這種方法使用多個知識圖譜打通了不同類型信息的語義鴻溝,在會話推薦系統(tǒng)的任務(wù)上起到了很好效果,也為融入多個外部的知識圖譜提供了一條可行之路。

數(shù)據(jù)質(zhì)量方面,在處理不同知識圖譜對齊問題中,本年度提出了一種不同知識圖譜中語義相似的實體進行關(guān)聯(lián)時的噪音問題的解決方法。在現(xiàn)有方法大多都是面向干凈數(shù)據(jù)的前提下,帶有噪音檢測和基于噪音感知的實體融合方法探索出了一種魯棒的實體對齊方式,魯棒性的跨語言實體對齊模型,通過圖神經(jīng)網(wǎng)絡(luò)建模知識圖譜中的實體對,得到噪音感知的實體對齊模塊,利用生成對抗網(wǎng)絡(luò)來生成噪音實體對并訓(xùn)練一個噪音判別器,識別出干凈的實體對。

3.知識推理

知識推理方面,多種新穎觀點在頂級會議上被提出,例如:圖譜推理在圖像視頻描述生成領(lǐng)域的應(yīng)用,以及垂直領(lǐng)域的推理任務(wù)等。

在常識問答方面,可以基于圖的上下文表示學(xué)習(xí)和基于圖的推理方法,利用不同結(jié)構(gòu)的知識源進行常識問答。不針對于具體領(lǐng)域和具體任務(wù),本年度還提出了一個 RNNLogic 的概率方法,該方法包括一個使用遞歸神經(jīng)網(wǎng)絡(luò)生成邏輯規(guī)則的規(guī)則生成器,和一個帶有邏輯規(guī)則的推理預(yù)測器,并使用基于 EM 算法的優(yōu)化,從學(xué)習(xí)邏輯規(guī)則的角度給出了一個知識圖譜推理的有效方案。

另外也有基于知識圖譜的向量嵌入技術(shù),完全基于向量操作進行推理演算;基于 Neural Logic Programming 框架,在數(shù)值推理問題方面也向前邁進了一步。

圖機器學(xué)習(xí)

圖機器學(xué)習(xí)領(lǐng)域目前剛剛到達圖論和機器學(xué)習(xí)的交叉點。包括圖上深度學(xué)習(xí)的啟發(fā)式應(yīng)用到圖模型范圍等問題都在進行廣泛和深入的研究。

同時,知識圖譜與機器學(xué)習(xí)相結(jié)合的研究也逐漸增多,相關(guān)研究成果在頂級會議上的提交率有所增長:

1.在圖嵌入方向,學(xué)者提出了一種新的 KGE 框架自動實體類型表示(AutoETER)[21],通過將每個關(guān)系看作是兩個實體類型之間的轉(zhuǎn)換(translation)操作來學(xué)習(xí)每個實體的潛在類型嵌入,并利用關(guān)系感知映射機制來學(xué)習(xí)每個實體的潛在類型嵌入;

2.知識推理方向,學(xué)者提出了一種新的框架,用于嵌入學(xué)習(xí)和跨多個特定語言的 KG 進行集成知識遷移。該框架將所有 KG 嵌入到一個共享的嵌入空間中,在那里基于自學(xué)習(xí)捕獲實體之間的關(guān)聯(lián)。然后,進行集成推理,合并來自多個特定語言 KG 嵌入的預(yù)測結(jié)果;

3.知識圖譜與推薦系統(tǒng)結(jié)合方向,學(xué)者首先算出圖中各類型節(jié)點的嵌入,結(jié)合注意力機制,利用鄰居節(jié)點為中心節(jié)點提供更豐富的信息,然后利用傳統(tǒng)的“頭結(jié)點+關(guān)系=目標(biāo)節(jié)點”的方法訓(xùn)練最終的圖嵌入表示,最后接入下游的推薦系統(tǒng)模型。此外,圖神經(jīng)網(wǎng)絡(luò) GNN 被廣泛應(yīng)用于圖機器學(xué)習(xí)。前沿的關(guān)于圖機器學(xué)習(xí)的研究對 GNN 有更扎實的理論理解。

圖數(shù)據(jù)庫

2020 年以來,為了滿足強關(guān)聯(lián)和網(wǎng)絡(luò)型數(shù)據(jù)的存儲、查詢和大規(guī)模圖分析的性能需求,圖數(shù)據(jù)庫在其底層數(shù)據(jù)結(jié)構(gòu)的設(shè)計上也盡量貼合關(guān)系數(shù)據(jù)的搜索模式,減少磁盤的 I/O 操作時間。傳統(tǒng)關(guān)系型數(shù)據(jù)庫的 B+樹數(shù)據(jù)結(jié)構(gòu)在數(shù)據(jù)檢索和隨機數(shù)據(jù)讀取上有優(yōu)秀的性能,而對于關(guān)系數(shù)據(jù)的遍歷則顯得相形見絀了。

分布式圖數(shù)據(jù)庫在對圖分割上有以點分割和以邊分割 2 種方案。在 2020 年越來越多的新型分布式圖數(shù)據(jù)庫會選擇以邊分割的方案,甚至是把圖節(jié)點的屬性和邊同樣對待,統(tǒng)稱為謂詞。相同的謂詞會存在同一臺或幾臺機器上。這樣很多查詢,特別是多跳查詢可以集中在少量的機器上完成,大大減少數(shù)據(jù)傳輸帶來的網(wǎng)絡(luò)開銷。新型的分布式圖數(shù)據(jù)庫在百億數(shù)據(jù)量的規(guī)模下, 單點的多跳查詢能做到毫秒級返回。

二、主要應(yīng)用

知識圖譜是把人類的知識和經(jīng)驗代碼化的有效工具,賦予機器認知智能以構(gòu)建智能體在不同應(yīng)用場景中代替或幫助人類解決實際問題。

接下來,我們將從通用和垂直兩個層面探討其應(yīng)用。

首先,知識圖譜在通用領(lǐng)域的應(yīng)用:

1.數(shù)據(jù)治理

2020 年,知識圖譜被逐漸應(yīng)用在數(shù)據(jù)治理中。政務(wù)、金融、審計等行業(yè)均有嘗試。

部分企業(yè)提出數(shù)據(jù)、管理、業(yè)務(wù)的三層圖譜概念。也有企業(yè)從場景落地出發(fā),提出“數(shù)據(jù)”與“知識”雙驅(qū)動:即,從生產(chǎn)、經(jīng)營、管理等實際業(yè)務(wù)場景出發(fā),將業(yè)務(wù)、流程、指標(biāo)中的知識構(gòu)建成知識圖譜。

一方面,應(yīng)用知識圖譜將業(yè)務(wù)場景與數(shù)據(jù)關(guān)聯(lián)起來,讓機器知道什么業(yè)務(wù)場景需要什么數(shù)據(jù),這些數(shù)據(jù)必須達到怎樣的標(biāo)準(zhǔn)和質(zhì)量,進而幫助數(shù)據(jù)治理;另一方面,通過數(shù)據(jù)治理所形成的業(yè)務(wù)發(fā)現(xiàn)沉淀到知識圖譜里,在數(shù)字化轉(zhuǎn)型中釋放價值。

這樣一來,一些傳統(tǒng)數(shù)據(jù)治理中的難題得到進一步解決:通過知識、模型以及圖結(jié)構(gòu)的應(yīng)用,一些錯誤的、不一致的信息可以被發(fā)現(xiàn)、統(tǒng)一;基于業(yè)務(wù)規(guī)則定義,可識別潛在的數(shù)據(jù)關(guān)聯(lián)關(guān)系,進一步補充信息。

知識圖譜將業(yè)務(wù)數(shù)據(jù)、產(chǎn)業(yè)知識、通用常識、機理模型、決策網(wǎng)絡(luò)、機器學(xué)習(xí)模型進行混合存儲,實現(xiàn)知識和數(shù)據(jù)沉淀賦能智能應(yīng)用。在業(yè)務(wù)場景的驅(qū)動下,應(yīng)用知識圖譜可以有效實現(xiàn)數(shù)據(jù)治理與業(yè)務(wù)治理的迭代閉環(huán)。

2.搜索與推薦

隨著知識圖譜的深層應(yīng)用,2020 年,搜索與推薦更加智能,并在消費領(lǐng)域之外的生產(chǎn)、管理等方向不斷下沉。

在面向生產(chǎn)、管理等垂直業(yè)務(wù)領(lǐng)域,領(lǐng)域知識、事件圖譜的應(yīng)用提升了檢索效率與質(zhì)量。一些非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用較多的專業(yè),如審計、醫(yī)療、金融、司法、各類型研究結(jié)構(gòu)等,文書、文獻、案例/判例、研究成果、專家經(jīng)驗被引入到領(lǐng)域知識圖譜的構(gòu)建中。通過對不同層次知識分析、加工、結(jié)構(gòu)化處理,在常規(guī)檢索之外,實現(xiàn)知識的鉆取和深度挖掘。

在這個過程中,一些企業(yè)通過知識標(biāo)注工具,將業(yè)務(wù)實體、屬性和關(guān)聯(lián)關(guān)系標(biāo)記出來,把標(biāo)記的實體和關(guān)系存入知識庫,并把它們沉淀成自動知識抽取模型的訓(xùn)練語料;也有一些企業(yè)通過映射、連接及各類 D2R 操作,將結(jié)構(gòu)化數(shù)據(jù)庫的數(shù)據(jù)字典、表結(jié)構(gòu)、關(guān)系及數(shù)據(jù)庫內(nèi)容轉(zhuǎn)換為知識圖譜的本體、業(yè)務(wù)實體、實體間關(guān)系組成的三元組,以便于人們從研究對象、研究主題、業(yè)務(wù)分類等多個維度檢索出相關(guān)結(jié)果。

其次,知識圖譜在垂直領(lǐng)域的應(yīng)用:

1.智慧生產(chǎn)

工業(yè)知識圖譜是知識圖譜的重點發(fā)展方向。今年人們對知識圖譜在生產(chǎn)領(lǐng)域的探索貫穿了產(chǎn)品生產(chǎn)的各個環(huán)節(jié):

(1)仿真模擬

以石油化工業(yè)領(lǐng)域的應(yīng)用為例??紤]到石化產(chǎn)業(yè)具有易燃易爆、工藝復(fù)雜等特點,現(xiàn)實中有大量無法通過機理模型或模擬軟件解釋的現(xiàn)象。為方便生產(chǎn)線工人的日常作業(yè),人們通過構(gòu)建產(chǎn)業(yè)鏈知識圖譜,在短時間內(nèi)從眾多影響因子的因果變化關(guān)系中進行生產(chǎn)操作前的模擬:如工人準(zhǔn)備改變某可操作變量時,可通過圖譜預(yù)測操作帶來的變化;如工人試圖達到某結(jié)果時,可通過圖譜提前預(yù)判操作步驟。

(2)產(chǎn)品研發(fā):

在知識圖譜的支撐下可以圍繞產(chǎn)品發(fā)展趨勢為新產(chǎn)品市場定位提供決策知識;可以識別新產(chǎn)品在不同使用場景下的使用方法和使用要求,推送其他產(chǎn)品的應(yīng)用案例;還可以提供已有的相似產(chǎn)品、相關(guān)技術(shù)、領(lǐng)域?qū)<液托畔⒒ぞ哕浖刃畔ⅰ?/p>

(3)產(chǎn)品質(zhì)量提升:

通過監(jiān)控生產(chǎn)過程中的實時參數(shù)曲線構(gòu)建核心部件的健康指數(shù)模型,在識別關(guān)鍵因素的基礎(chǔ)上進行參數(shù)推薦,提升良品率。

(4)生產(chǎn)預(yù)測:

在機理模型與經(jīng)驗?zāi)P腿诤系幕A(chǔ)上,結(jié)合生產(chǎn)知識圖譜實現(xiàn)圖迭代計算,計算出某因子發(fā)生變化時整個關(guān)系網(wǎng)絡(luò)達到穩(wěn)定后各個產(chǎn)物節(jié)點的狀態(tài)值,實現(xiàn)更準(zhǔn)確的生產(chǎn)預(yù)測[26]。

(5)供應(yīng)鏈風(fēng)險管理及零部件選型:

可以匯集產(chǎn)品知識、物流知識、采購知識、制造知識、交通信息等等構(gòu)建供應(yīng)鏈及零部件圖譜,將采購、物流、制造聯(lián)系起來,通過語義網(wǎng)(關(guān)系網(wǎng))實現(xiàn)供應(yīng)鏈風(fēng)險管理與零部件選型。

(6)節(jié)能減排:

集成、分析物聯(lián)網(wǎng)傳感器和系統(tǒng)的信息,打通建筑物管理、居住舒適度調(diào)節(jié)、電源監(jiān)控等數(shù)據(jù)孤島,構(gòu)建智能建筑領(lǐng)域的物聯(lián)網(wǎng)知識圖譜。降低開發(fā)者工程師的工作量,實現(xiàn)最優(yōu)化的智能建筑運營。

(7)設(shè)備故障預(yù)警與安全生產(chǎn):

以石油領(lǐng)域為例,油田聯(lián)合站承擔(dān)原油處理、存儲與外輸任務(wù),是一級防火、甲級防爆單位。通過設(shè)備知識圖譜和決策知識圖譜,一方面可以將設(shè)備的生產(chǎn)參數(shù)變化轉(zhuǎn)換為狀態(tài)變化和各種生產(chǎn)現(xiàn)象,模擬專家分析設(shè)備運行過程,對設(shè)備運行狀態(tài)進行預(yù)測;此外,還能基于不同生產(chǎn)現(xiàn)象的變化在決策圖譜中自動選擇最優(yōu)措施方案,生成決策建議,通知現(xiàn)場管理人員進行現(xiàn)場作業(yè)和處理。

2.智能營銷

消費者、商品的圖譜構(gòu)建更加深入、完善。

(1)消費者:

數(shù)據(jù)進一步打通。除用戶基本信息、行為特征之外,興趣、場景、需求等內(nèi)容也逐漸豐富到消費者圖譜內(nèi)。用戶價值模型、購買驅(qū)動因素模型等模型應(yīng)用也擴展了圖譜內(nèi)容。

(2)商品:

一些企業(yè)通過構(gòu)建事件圖譜、視頻理解圖譜強化對事件、場景的感知,嘗試從文本到多媒體的跨越,豐富產(chǎn)品構(gòu)建內(nèi)容;在消費品領(lǐng)域,消費者對產(chǎn)品的別稱、昵稱、縮寫等非常豐富,制約了圖譜構(gòu)建效率,還有一些企業(yè)在圖融合領(lǐng)域不斷探索,提升實體的自動化對齊效果。

部分應(yīng)用:

(1)自動撰文:

挖掘主競品文章中對業(yè)務(wù)有價值的高頻詞語和短語,形成實體庫;通過本體及實體的挖掘找到人群與需求、人群與場景的關(guān)系;挖掘?qū)傩院驮u價詞語,與相關(guān)實體關(guān)聯(lián),形成實體的評價印象;解析句子的語法結(jié)構(gòu)以及與本體、實體的關(guān)聯(lián),使機器撰寫更接近人的行文習(xí)慣。

(2)購買意向預(yù)測與內(nèi)容推薦:

結(jié)合機器感知、特征標(biāo)簽和業(yè)務(wù)經(jīng)驗對用戶特征進行價值挖掘,把用戶特征輸出成參數(shù),用模型篩選出適合參加某些活動的人群;通過聚類,利用 K-means 對具有較高購買可能性的人群進行類別劃分;針對不同群體的需求,如價格、興趣、場景等傳遞不同的內(nèi)容信息,提升內(nèi)容推薦效果。

3.AIOps(智能運維)

主要是將知識圖譜與根因分析相結(jié)合,進一步提升運維效率和質(zhì)量。

今年比較流行的做法是:通過應(yīng)用業(yè)務(wù)日志、CMDB 配置系統(tǒng)等數(shù)據(jù)構(gòu)建異常事件圖譜;再運用推導(dǎo)模型進行根因定位,對存在異常的子系統(tǒng)及其相關(guān)的 IP、DCN、服務(wù)信息進行提取,對異常事件知識圖譜進行裁剪;最后,再應(yīng)用規(guī)則引擎推導(dǎo)出根因結(jié)論。

一些企業(yè)會針對告警數(shù)據(jù)進行分類,利用軟硬件知識圖譜將有關(guān)聯(lián)的物理機、虛擬機和軟件數(shù)據(jù)匯聚為一組,便于后續(xù)建模和應(yīng)用;一些企業(yè)對不同時間粒度的樣本構(gòu)建因果圖,通過對算法構(gòu)建的因果圖構(gòu)建告警知識圖譜,讓運維人員在快速查詢故障設(shè)備信息的基礎(chǔ)上進一步了解故障發(fā)生原因以及后續(xù)處理步驟;

還有一些企業(yè)嘗試將基于專家規(guī)則的推理與基于描述邏輯的推理、基于分布式表示的表示學(xué)習(xí)推理、本體推理、復(fù)合推理相結(jié)合,利用知識圖譜讓系統(tǒng)自動采取相應(yīng)的恢復(fù)手段、維護策略,實現(xiàn)網(wǎng)絡(luò)的 “自維護”。

4.智能管理

這里,我們主要介紹在政府管理中的應(yīng)用。

我們知道,在政府日常管理中,政務(wù)數(shù)據(jù)與政府、企業(yè)、非盈利組織和公民等多角色密切相關(guān),需要依據(jù)各類規(guī)章制度,涉及大量單據(jù)、文檔材料等非結(jié)構(gòu)化、半結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)。由于政務(wù)業(yè)務(wù)的變動和對數(shù)據(jù)的認知變化導(dǎo)致的數(shù)據(jù)類別上的增加或變化的發(fā)生頻率很高,知識圖譜的本體自動構(gòu)建技術(shù)和基于動態(tài)知識圖譜的數(shù)據(jù)集成方案技術(shù)非常必要。

今年,一些企業(yè)正在基于聚類算法和強化學(xué)習(xí)結(jié)合的模式開發(fā) schema 自動構(gòu)建和根據(jù)反饋調(diào)整知識圖譜的能力來滿足業(yè)務(wù)動態(tài)變化的需求,以減少工作成本,提升效率。還有一些企業(yè)利用動態(tài)知識譜圖技術(shù),將模型與數(shù)據(jù)進行解耦,降低大規(guī)模數(shù)據(jù)集成場景下知識圖譜變化帶來的計算壓力。

通過知識圖譜的應(yīng)用,一方面打破了數(shù)據(jù)孤島,將大規(guī)模、碎片化的多源政務(wù)數(shù)據(jù)關(guān)聯(lián)起來,以實體為基本單位對政務(wù)數(shù)據(jù)進行挖掘,揭示各實體間的復(fù)雜關(guān)系,實現(xiàn)知識層面的數(shù)據(jù)融合與集成。同時,也更大程度的釋放了政務(wù)數(shù)據(jù)價值,為政府部門、企業(yè)、非營利組織、公民提供更高水準(zhǔn)的服務(wù),提高政府監(jiān)管效率和效能。

三、知識圖譜行業(yè)和技術(shù)發(fā)展的展望

1、技術(shù)發(fā)展趨勢展望

知識圖譜主要技術(shù)包括知識獲取、知識表示、知識存儲、知識建模、知識融合、知識計算、知識運維等七個方面,盡管目前已取得了很多成就,但仍在快速演進當(dāng)中。

例如,在知識獲取方面,資源缺乏、面向開放域、跨語言及跨媒體等方向的知識抽取正在成為未來的研究方向;

在知識表示方面,符號與表示學(xué)習(xí)的融合統(tǒng)一、面向事理邏輯的知識表示、融合時空間維度的知識表示、融合跨媒體元素的知識表示正在成為未來的研究方向;

在知識存儲方面,基于 RDF 和 LPG 知識表示的分布式存儲、涉及高適應(yīng)性的知識存儲、基于 LOD(Linked Open Data)的知識存儲、Hyper Graph 的進一步研究和應(yīng)用正在成為未來的研究方向。

2、應(yīng)用趨勢展望

目前,大規(guī)模知識圖譜的應(yīng)用場景還比較有限,其在智能語義搜索、深度問答(包括基于信息檢索的問答系統(tǒng)、基于語義分析的問答系統(tǒng))、演化分析、對話理解等方面的應(yīng)用也處于初級階段,仍具有廣闊的應(yīng)用與推廣前景。

從知識圖譜應(yīng)用發(fā)展趨勢來看,當(dāng)前正在從通用知識圖譜應(yīng)用向領(lǐng)域或行業(yè)知識圖譜應(yīng)用拓展,如金融、醫(yī)療、公安、醫(yī)療、司法、電商等,依托知識圖譜強大知識庫的深度知識推理能力和逐步擴展的認知能力,幫助相關(guān)行業(yè)從業(yè)者對特定的問題進行分析、推理、輔助決策。

3、標(biāo)準(zhǔn)化趨勢展望

隨著 ISO/IEC JTC1/SC42、W3C、IEEE、全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會、國家人工智能標(biāo)準(zhǔn)化總體組等國內(nèi)外標(biāo)準(zhǔn)化組織或機構(gòu)對知識圖譜標(biāo)準(zhǔn)化的關(guān)注與推動,《知識圖譜技術(shù)架構(gòu)》等多項知識圖譜相關(guān)國際、國家標(biāo)準(zhǔn)獲得立項或提出討論。

未來,知識圖譜領(lǐng)域基礎(chǔ)共性及關(guān)鍵技術(shù)標(biāo)準(zhǔn)將不斷涌現(xiàn),依托正在研制的知識圖譜技術(shù)架構(gòu)等標(biāo)準(zhǔn),通過聚焦核心標(biāo)準(zhǔn)化需求逐步建立基本的知識圖譜標(biāo)準(zhǔn)體系并孵化典型行業(yè)中的知識圖譜應(yīng)用標(biāo)準(zhǔn),形成國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和團體標(biāo)準(zhǔn)良性互動的局面。

4、技術(shù)開發(fā)與應(yīng)用相關(guān)建議

(1)加強知識圖譜核心關(guān)鍵技術(shù)支持與突破:

突破知識圖譜基礎(chǔ)理論及關(guān)鍵核心技術(shù)瓶頸,以算法為核心,以數(shù)據(jù)和硬件為基礎(chǔ),以大規(guī)模知識庫的構(gòu)建與應(yīng)用為導(dǎo)向,實施重大關(guān)鍵技術(shù)攻關(guān)工程。

(2)加強知識圖譜優(yōu)秀解決方案/產(chǎn)品展示與推廣:

通過梳理知識圖譜在典型行業(yè)的優(yōu)秀案例并形成案例集,建設(shè)開放性實驗室,推出優(yōu)質(zhì)培訓(xùn)課程等方式加強知識圖譜優(yōu)秀平臺或產(chǎn)品的展示與推廣,打破知識圖譜開發(fā)企業(yè)、研究院所、高校與各領(lǐng)域企業(yè)間的溝通屏障。

(3)加強通用和領(lǐng)域知識圖譜開放平臺建設(shè):

開放的通用知識圖譜和領(lǐng)域知識圖譜平臺是推動知識圖譜技術(shù)在各行業(yè)融合應(yīng)用的重要基礎(chǔ)設(shè)施,能夠避免企業(yè)在建設(shè)知識圖譜過程中從零開始或重復(fù)建設(shè),也可降低知識圖譜項目實施方的設(shè)計開發(fā)成本。

11月11-15日

一、知識圖譜概論

1.1知識圖譜的起源和歷史

1.2知識圖譜的發(fā)展史——從框架、本體論、語義網(wǎng)、鏈接數(shù)據(jù)到知識圖譜

1.3知識圖譜的本質(zhì)和價值

1.4知識圖譜VS傳統(tǒng)知識庫VS關(guān)系數(shù)據(jù)庫

1.5經(jīng)典的知識圖譜

二、知識圖譜應(yīng)用

2.1知識圖譜應(yīng)用場景

2.2知識圖譜應(yīng)用簡介

三、知識表示與知識建模

3.1知識表示概念

3.2 知識表示方法

3.3典型知識庫項目的知識表示

3.4知識建模方法學(xué)

3.5知識表示和知識建模實踐

四、知識抽取與挖掘

4.1知識抽取基本問題

4.2數(shù)據(jù)采集和獲取

4.3面向結(jié)構(gòu)化數(shù)據(jù)的知識抽取

4.4面向半結(jié)構(gòu)化數(shù)據(jù)的知識抽取

4.5.面向非結(jié)構(gòu)化數(shù)據(jù)的知識抽取

4.6.知識挖掘

4.7知識抽取上機實踐

五、知識融合

5.1知識融合背景

5.2知識異構(gòu)原因分析

5.3知識融合解決方案分析

5.4.本體對齊基本流程和常用方法

5.5實體匹配基本流程和常用方法

5.6 知識融合上機實踐

六、存儲與檢索

6.1.知識圖譜的存儲與檢索概述

6.2.知識圖譜的存儲

6.3.知識圖譜的檢索

6.4.上機實踐案例:利用GraphDB完成知識圖譜的存儲與檢索

七、知識推理

7.1.知識圖譜中的推理技術(shù)概述

7.2.歸納推理:學(xué)習(xí)推理規(guī)則

上機實踐案例:利用AMIE+算法完成Freebase數(shù)據(jù)上的關(guān)聯(lián)規(guī)則挖掘

7.3.演繹推理:推理具體事實

7.4.基于分布式表示的推理

7.5.上機實踐案例:利用分布式知識表示技術(shù)完成Freebase上的鏈接預(yù)測

八、語義搜索

8.1.語義搜索概述

8.2.搜索關(guān)鍵技術(shù)

8.3.知識圖譜搜索

8.4.知識可視化

8.5.上機實踐案例:SPARQL搜索

九、知識問答

9.1.知識問答概述

9.2.知識問答基本流程

9.3.相關(guān)測試集:QALD、WebQuestions等

9.4.知識問答關(guān)鍵技術(shù)

9.5.上機實踐案例:DeepQA、TemplateQA


審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    7665
收藏 人收藏

    評論

    相關(guān)推薦

    普華基礎(chǔ)軟件通過軟件能力成熟度5級認證

    近日,普華基礎(chǔ)軟件正式通過軟件能力成熟度5級(CMMI DEV 3.0,Maturity Level 5)認證,標(biāo)志著公司在軟件研發(fā)、項目管理、過程管理、量化管理、質(zhì)量管理等方面達到國際領(lǐng)先水平,能高質(zhì)量、高效率的保證項目實施交付。
    的頭像 發(fā)表于 08-28 17:23 ?535次閱讀

    持續(xù)領(lǐng)跑 涂鴉智能再度入圍Gartner《 中國智慧城市和可持續(xù)發(fā)展技術(shù)成熟度曲線》報告

    and Sustainability in China,2024》(《2024年中國智慧城市和可持續(xù)發(fā)展技術(shù)成熟度曲線》)。該指南基于智慧城市和可持續(xù)發(fā)展方面的現(xiàn)狀和遠景,深入分析了各項新興技術(shù)
    的頭像 發(fā)表于 08-22 13:10 ?198次閱讀
    持續(xù)領(lǐng)跑 涂鴉智能再度入圍Gartner《 中國智慧城市和可持續(xù)發(fā)展<b class='flag-5'>技術(shù)</b><b class='flag-5'>成熟度</b>曲線》報告

    三星電子將收購英國知識圖譜技術(shù)初創(chuàng)企業(yè)

    在人工智能技術(shù)日新月異的今天,三星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術(shù)創(chuàng)新實力。近日,三星正式宣布完成了對英國領(lǐng)先的人工智能(AI)與知識圖譜技術(shù)初創(chuàng)企業(yè)Oxford Seman
    的頭像 發(fā)表于 07-18 14:46 ?436次閱讀

    知識圖譜與大模型之間的關(guān)系

    在人工智能的廣闊領(lǐng)域中,知識圖譜與大模型是兩個至關(guān)重要的概念,它們各自擁有獨特的優(yōu)勢和應(yīng)用場景,同時又相互補充,共同推動著人工智能技術(shù)的發(fā)展。本文將從定義、特點、應(yīng)用及相互關(guān)系等方面深入探討知識圖譜與大模型之間的關(guān)系。
    的頭像 發(fā)表于 07-10 11:39 ?650次閱讀

    智能制造能力成熟度模型是什么?

    智能制造能力成熟度模型(Capability Maturity Model for Manufacture,簡稱CMMM)描述了智能制造從初始狀態(tài)向高級階段的發(fā)展過程,將其分解為若干級別(階段
    的頭像 發(fā)表于 06-12 11:25 ?322次閱讀
    智能制造能力<b class='flag-5'>成熟度</b>模型是什么?

    聯(lián)想集團聯(lián)合中國信通院正式發(fā)布《中國企業(yè)智能化成熟度報告2023》

    3月27日,由聯(lián)想集團和中國信息通信研究院共同撰寫的《中國企業(yè)智能化成熟度報告(2023)》(以下簡稱《報告》)正式發(fā)布。
    的頭像 發(fā)表于 03-28 09:45 ?329次閱讀
    聯(lián)想集團聯(lián)合中國信通院正式發(fā)布《中國企業(yè)智能化<b class='flag-5'>成熟度</b>報告2023》

    基于高光譜的不同成熟期哈密瓜堅實研究

    哈密瓜是新疆的特色水果,目前,哈密瓜品種繁多,采收時,不同品種的成熟期不同,在成熟時的表現(xiàn)也不同,因此,簡單地通過外表來分辨哈密瓜的成熟度,會造成判別不一致,影響哈密瓜的貨架期,從而
    的頭像 發(fā)表于 03-12 15:41 ?277次閱讀
    基于高光譜的不同<b class='flag-5'>成熟</b>期哈密瓜堅實<b class='flag-5'>度</b>研究

    MES深化應(yīng)用五級成熟度模型介紹

    電子發(fā)燒友網(wǎng)站提供《MES深化應(yīng)用五級成熟度模型介紹.docx》資料免費下載
    發(fā)表于 02-23 17:10 ?1次下載

    利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?955次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index<b class='flag-5'>技術(shù)</b>構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    知識圖譜基礎(chǔ)知識應(yīng)用和學(xué)術(shù)前沿趨勢

    知識圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系。是融合了認知計算、知識表示與推理、信息檢索與抽取、自然語言處理、Web技術(shù)、機器學(xué)習(xí)與大數(shù)據(jù)挖掘等等方向的交叉學(xué)科。人工智能是以傳統(tǒng)符號派
    的頭像 發(fā)表于 01-08 10:57 ?722次閱讀
    <b class='flag-5'>知識圖譜</b>基礎(chǔ)<b class='flag-5'>知識</b>應(yīng)用和學(xué)術(shù)前沿趨勢

    太極半導(dǎo)體通過國家智能制造能力成熟度三級評估

    近日,中國電子技術(shù)標(biāo)準(zhǔn)化研究院公示了最新一批通過國家智能制造能力成熟度評估(CMMM)的企業(yè),太極半導(dǎo)體(蘇州)有限公司(以下簡稱:太極半導(dǎo)體)成功通過智能制造能力成熟度三級標(biāo)準(zhǔn)符合性評估,這標(biāo)志著公司實現(xiàn)了智能制造全流程數(shù)據(jù)的
    的頭像 發(fā)表于 01-04 11:32 ?693次閱讀

    AGV無線充電技術(shù)成熟度:系統(tǒng)穩(wěn)定性和環(huán)境適應(yīng)性的重要

    無線充電技術(shù)成熟不僅意味著技術(shù)本身的革新和突破,更是制造業(yè)未來競爭力的關(guān)鍵。當(dāng)AGV能被無線、高效、穩(wěn)定地充電,我們的工業(yè)生產(chǎn)現(xiàn)場將變得更加自動化、高效和靈活。只有在信號、充電效率、
    的頭像 發(fā)表于 12-22 10:47 ?448次閱讀

    華秋榮獲億邦動力2023產(chǎn)業(yè)互聯(lián)網(wǎng)千峰獎

    2023年億邦動力產(chǎn)業(yè)互聯(lián)網(wǎng)“千峰獎·數(shù)字供應(yīng)鏈” 這一殊榮,同時這也是華秋連續(xù)第四年獲此榮譽。 本屆千峰獎主題為 “誰在重構(gòu)產(chǎn)業(yè)鏈” ,企業(yè)分為數(shù)字供應(yīng)鏈、
    發(fā)表于 12-15 09:53

    智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜

    智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿
    發(fā)表于 12-11 17:36 ?1次下載

    知識圖譜與大模型結(jié)合方法概述

    本文作者 |? 黃巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》總結(jié)了大語言模型和知識圖譜融合的三種路線:1
    的頭像 發(fā)表于 10-29 15:50 ?849次閱讀
    <b class='flag-5'>知識圖譜</b>與大模型<b class='flag-5'>結(jié)合</b>方法概述