Methodologies for Cross-Domain Data Fusion: An Overview (reading notes)

0. 版權聲明

1. Introduction

  • 使用跨域數據融合的原因:平等地處理不同的數據集或將其簡單拼接,難以獲得良好的性能;
  • 跨域數據融合的3種方法:
    • Method 1:Stage-based,在同一任務的不同階段使用不同的數據集;
    • Method 2:Feature level-based,利用深度神經網絡從不同數據集中提取出原始特徵的新表示,將新的特徵表示用於分類或預測;
    • Method 3:Semantic meaning-based,基於語義的數據融合;
      • 基於多視角的方法:用不同的模型處理不同的特徵;
      • 基於相似性的方法;
      • 基於概率相關性的方法;
      • 基於遷移學習的方法;

2. Related work

2.1 與傳統數據集成的關係

  • 傳統數據集成:通過模式映射和重複檢測,將數據合併;
  • 跨域數據融合:用不同方法從不同數據集中提取知識,知識融合有別於模式映射;

2.2 與異構信息網絡的關係

  • 異構信息網絡:只鏈接某一領域內的對象;
    • E.g. 在書目信息網絡中,人員、會議和論文均來自書目領域;
  • 跨域數據融合:連接不同領域內的對象;

3. 基於階段的數據融合

4. 基於特徵層的數據融合

  • 基於特徵層的數據融合;
    • 直接連接;
    • 基於深度神經網絡的數據融合;

5. 基於語義的數據融合

  • 基於多視角的數據融合:
    • 協同訓練;
    • 多核學習;
    • 子空間學習;
  • 基於相似性的數據融合;
    • 協同過濾;
    • 矩陣分解;
    • 流形對齊;
  • 基於概率相關性的數據融合;
  • 基於遷移學習的數據融合:
    • 同類數據集間遷移;
    • 多個數據集間遷移;

References

[1] Zheng Y. Methodologies for cross-domain data fusion: An overview[J]. IEEE transactions on big data, 2015, 1(1): 16-34.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章