知識圖譜(Knowledge Graph),是一種以圖結構的方式存儲、管理和查詢知識的方法,它通過對海量非結構化的信息進行形式化建模,構建一個相互關聯、層次分明、可理解的知識網絡。知識圖譜通常由節點(node)和邊(border)組成。節點是實體或概念,邊則是實體之間或概念與概念之間的關系。其中每個實體都有其相關的屬性,這些屬性從多個角度定義了一個實體的特征。
定義
知識圖譜是一種以圖結構的方式存儲、管理和查詢知識的方法,它將海量非結構化的信息進行形式化建模,構建一個相互關聯、層次分明、可理解的知識網絡。將數據轉化為結構化數據,提供了從數據中獲取信息、進行決策分析的能力。
通過對海量非結構化信息進行形式化建模,構建一個相互關聯、層次分明、可理解的知識網絡,為各種智能應用提供了底層支撐,使得智能應用可以無縫嵌入到各種知識圖譜之中。
層次結構
按照層次結構可以分為四層:數據層、本體層、知識表示層、應用層。
數據層包含三元組、實體、屬性和關系。本體層描述實體及其關系,本體層提供實體及其關系的形式化表示,是知識圖譜的核心和基礎。知識表示層是將本體和關系從數據中抽象出來的過程,是知識圖譜的表現形式。應用層包括應用系統、知識庫和數據倉庫。
通過表示和計算將實體與實體之間的關聯關系轉化為有意義的語義信息,是知識圖譜中最重要的部分。知識表示法基于符號邏輯和抽象概念進行建模,其中符號邏輯主要用來表達概念之間的語義關系,抽象概念則用來表示概念所包含的內涵。
查詢方式
查詢方式有基于關系和基于屬性兩種。基于關系的查詢方式主要有傳統的查詢,即通過輸入關鍵字查詢實體之間的關系,并把關系映射到知識圖譜中;基于屬性的查詢方式則是通過輸入一個屬性來查詢多個實體,然后用它們之間的關系來表示知識圖譜。
通常情況下,節點都是實體,而邊則是實體之間或概念與概念之間的關系。在圖數據庫中,一個實體被標記為邊,而一個實體被標記為節點。
構建的過程
從數據、概念、實體及關系等多個角度出發,利用多個技術工具進行知識的抽取、融合、存儲和應用。
一般來說,知識圖譜的構建過程可以分為以下四個階段:
1.數據準備:將數據中的實體及關系抽取出來,并對數據進行清洗和規范;
2.概念抽取:將知識轉化為概念,并構建主體框架;
3.關系抽取:從概念中抽取實體之間的關系,并將其映射為圖譜中的實體和屬性;
4.圖譜構建:完成構建。
常見問題
知識圖譜是指由一系列定義明確、相互關聯的實體以及它們之間的關系組成的網絡。它可以對數據進行可視化,支持高效的查詢和分析,并提供更多的信息和知識。
它可以是結構化、非結構化的數據,也可以是文本、視頻、圖像、語音等非結構化數據。
知識圖譜是一個開放、共享和互操作的統一數據模型,可用于在不同類型的數據之間建立關聯關系,并支持在多種不同類型數據之間進行推理,其特點是對各種類型數據進行統一表達和存儲,并為各類知識之間的相互聯系和交互提供統一的接口。
(文章轉載于天潤融通)