An Efficient Graph Indexing Method 2012

文章簡介

  1. 文章標題:
    An Efficient Graph Indexing Method
  2. 文章鏈接
  3. 作者單位:
    王小麗#,丁小峯*,Anthony K.H. 董#,杉杉英#,海進*#
    新加坡國立大學計算機學院,電子郵件:{xiaoli,atung,shanshan}@comp.nus.edu.sg*
    華中科技大學計算機科學學院 中國電子郵件:{xfding,hjin}@hust.edu.c

文章正文

摘要—圖是表示複雜結構數據的流行模型,圖的相似性搜索已成爲一個基本的研究問題。已經提出了許多技術來支持基於圖編輯距離的相似性搜索。但是,它們都具有某些缺點:計算複雜度高,數據庫大小的可伸縮性差或無法充分利用索引。爲了解決這些問題,在本文中,我們提出了SEGOS,一種用於圖相似搜索的索引和查詢處理框架。首先,基於圖的子單元分解,離線構造有效的二級索引。然後,提出了一種基於索引的搜索策略。從TA和CA方法改編的兩種算法被無縫集成到所提出的增強圖搜索策略中。更具體地說,所提出的框架易於流水線支持連續圖修剪。在兩個真實數據集上進行了廣泛的實驗,以評估我們方法的有效性和可擴展性

文章總結

1.解決問題

幾年來圖相似度問題爲一種熱門問題,科學家們提出通過計算圖對之間的編輯距離來衡量倆個圖之間的相似度。圖編輯距離的計算分成倆類,一類是計算計算的圖之間的編輯距離,大都通過A* 算法的映射思路,缺點是映射空間大,不能在多項式時間內解決(NP-Hard問題),同時A*算法也只能在不多餘12個頂點的圖內應用,計算複雜度是指數級的複雜度;還有一種方法是通過近似計算圖的編輯距離的方法,通常採用“上界和下界”近似估計的方法。在使用上界和下界進行估計的方法中,利用給定的相似度閾值,如果倆個圖之間的上界和下界的值不滿足閾值的要求,那麼可以過濾掉這些圖。上界和下界值的計算,一般和倆個圖之間的公共子結構有關(比如公共的星結構、公共的n-gram、公共的k-AT)等。如果要計算倆個圖的公共子結構的個數,必須一一列舉出倆個圖中的子結構,然後一一比對數據庫中所有圖的子結構的個數,挨個遍歷每個圖。這無疑增大了算法的運行效率。因此,本文爲了避免逐個遍歷數據庫中每個圖,提出了“SEGOS(SEarching similar Graphs based on Sub-units”的方法。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章