《RDF Graph Partitions: a Brief Survey》——筆記

Abstract

給出圖分割的理由和解決方案。使用經典圖形理論解決圖分割問題。提出四種將RDF圖轉換爲古典圖形的方法。

Introduction

語義Web和Linked Data environments的核心數據模型。
RDF圖規模太大,無法單機處理。早期的解決方法來此RDBMS。

Preliminaries

RDF是一個非常一般的數據模型,用於描述資源和他們之間的關係。
**Definition 2.1 (Subject, predicate and object).**Subject——資源,object——關係的值,謂詞表示資源的特徵或方面,並表示subject和object的關係。
**Definition 2.2 (RDF triple).**Assume that I is the set of all Internationalized Resource Identifier (IRI) references, B an infinite set of blank nodes, L the set of RDF literals. An RDF triple t is defined as a triple t=<s,p,o> where sLB is called the subject, pL is called the predicate and oIBL is called the object.
Definition 2.3 (IRIs) IRIs serve as global identifiers that can be used to identify any resource.
Definition 2.4 (Literals) Literals are a set of lexical values.包含字符串和數據類型。
Definition 2.5 (Blank nodes) existential variables used to denote the existence of some resource for which an IRI or literal is not given.
Definition 2.6 (RDF graph) let L=LSLLLD,O=IBL and S=IB , then GS×I×O is a finite subset of RDF triples, which is called RDF graph.
報警了, 這個定義是什麼鬼?
Definition 2.7 (Directed labeled graph) Directed labeled graph G is a quadruple G=(V,E,lbl,L) , where V is a set of vertices, E={(v1,v2)|v1,v2V} is a set of directed edges, lbl:EVL is a labeling function, and L is a set of labels.
Definition 2.8 (k-way graph partition) Given a graph G=(V,E,lbl,L) , a k-way graph partitioning, C, is a division of V into k partitions {P1,P2,...,Pk} such that 1ikPi=V , and PiPj= for any ij

RDF Graph Partition

Classical Graph Partitioning

最被認可的圖劃分算法是在METIS軟件包中的gpmetis。gpmetis基於多級圖分割,有三個階段:圖粗化,初始分區,圖解析。粗化階段,通過將相鄰頂點對儘量摺疊在一起,將輸入圖轉化成一系列較小的圖。初始分區,當所得到的圖形足夠低時,使用kernighan-Lin算法進行分割。解析階段,分區展開被摺疊的頂點,投影成較大的圖。

3.2 Relation Between Classical Graphs and RDF Graphs

所有的圖劃分算法(graph partitioning algorithms)都可被用在RDF圖中,如果他們轉化爲classical graph表示。三元組的轉換是最簡單的情況。
對於三元組t=<s,p,o> 其中sIB,pL,oIBL 被轉換成有向邊spo ,其中s,oV,pL
問題:三元組中p和s、o是相交的,但邊中ps,o 不相交。
解決方法

  1. <s,p,o> 轉換爲v1(s)pv2(o) 其中v1,v2V 並且s,p,oL
  2. 轉換爲超圖,即可以讓邊連接多於兩個節點,這種方法s,p,o都被轉化成頂點。但需要爲其專門設計算法,且效率不如簡單圖。
  3. 以超圖爲起點,將RDF圖轉換成二分圖。如下圖
    這裏寫圖片描述
  4. 將每個RDF三元組轉換成不同的圖形節點,並在共享主題,對象和/或謂詞的那些節點之間生成邊。

RDF比傳統圖更通用,有向有標記的圖可以很容易轉換成RDF圖,但是反向變換很麻煩。這意味着每個RDF圖的問題的複雜性並不比相應的經典圖形問題的複雜性要好。
這裏也不太懂。。

Experiment

第四種方法不如第一種好。

Conclusions

提出了RDF圖分區研究領域的工作,提供了RDF圖的經典圖分割的見解,覺少了古典圖和RDF圖之間的形式關係。
We outlined a partition of the vertices of an RDF graph into two disjoint subsets. In this paper we presented works from the RDF graph partitions research area. This paper provided insights on classical graph partitioning of RDF graphs. Moreover, we presented formal relationships between classical graphs and RDF graphs. Finally, we presented experiments, which showed a great potential for the presented approaches.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章