Abstract
給出圖分割的理由和解決方案。使用經典圖形理論解決圖分割問題。提出四種將RDF圖轉換爲古典圖形的方法。
Introduction
語義Web和Linked Data environments的核心數據模型。
RDF圖規模太大,無法單機處理。早期的解決方法來此RDBMS。
Preliminaries
RDF是一個非常一般的數據模型,用於描述資源和他們之間的關係。
**Definition 2.1 (Subject, predicate and object).**Subject——資源,object——關係的值,謂詞表示資源的特徵或方面,並表示subject和object的關係。
**Definition 2.2 (RDF triple).**Assume that
Definition 2.3 (IRIs) IRIs serve as global identifiers that can be used to identify any resource.
Definition 2.4 (Literals) Literals are a set of lexical values.包含字符串和數據類型。
Definition 2.5 (Blank nodes) existential variables used to denote the existence of some resource for which an IRI or literal is not given.
Definition 2.6 (RDF graph) let
報警了, 這個定義是什麼鬼?
Definition 2.7 (Directed labeled graph) Directed labeled graph G is a quadruple
Definition 2.8 (k-way graph partition) Given a graph
RDF Graph Partition
Classical Graph Partitioning
最被認可的圖劃分算法是在METIS軟件包中的gpmetis。gpmetis基於多級圖分割,有三個階段:圖粗化,初始分區,圖解析。粗化階段,通過將相鄰頂點對儘量摺疊在一起,將輸入圖轉化成一系列較小的圖。初始分區,當所得到的圖形足夠低時,使用kernighan-Lin算法進行分割。解析階段,分區展開被摺疊的頂點,投影成較大的圖。
3.2 Relation Between Classical Graphs and RDF Graphs
所有的圖劃分算法(graph partitioning algorithms)都可被用在RDF圖中,如果他們轉化爲classical graph表示。三元組的轉換是最簡單的情況。
對於三元組
問題:三元組中p和s、o是相交的,但邊中
解決方法:
<s,p,o> 轉換爲v1(s′)⟶p′v2(o′) 其中v1,v2∈V 並且s′,p′,o′∈L - 轉換爲超圖,即可以讓邊連接多於兩個節點,這種方法s,p,o都被轉化成頂點。但需要爲其專門設計算法,且效率不如簡單圖。
- 以超圖爲起點,將RDF圖轉換成二分圖。如下圖
- 將每個RDF三元組轉換成不同的圖形節點,並在共享主題,對象和/或謂詞的那些節點之間生成邊。
RDF比傳統圖更通用,有向有標記的圖可以很容易轉換成RDF圖,但是反向變換很麻煩。這意味着每個RDF圖的問題的複雜性並不比相應的經典圖形問題的複雜性要好。
這裏也不太懂。。
Experiment
第四種方法不如第一種好。
Conclusions
提出了RDF圖分區研究領域的工作,提供了RDF圖的經典圖分割的見解,覺少了古典圖和RDF圖之間的形式關係。
We outlined a partition of the vertices of an RDF graph into two disjoint subsets. In this paper we presented works from the RDF graph partitions research area. This paper provided insights on classical graph partitioning of RDF graphs. Moreover, we presented formal relationships between classical graphs and RDF graphs. Finally, we presented experiments, which showed a great potential for the presented approaches.