目錄<SCI 2區>
2.2 Linked open data enabled recommendation system
3. Proposed approach: recommender system with Linked Open Data
3.1 LOD for cold start problem in CF (RS-LOD)
3.2 Enhanced matrix factorization model for data saprsity
0.專有詞彙
data sparsity: 數據稀疏 cold start : 冷啓動
matrix factorization : 矩陣分解 knowledge base : 知識庫
accuracy : 準確性 user profile : 用戶模型(畫像)
rating matrix : 評分矩陣 resource description framework(RDF) : 資源描述框架
key features : 關鍵特徵 latent factors : 潛在因子
semantic features : 語義特徵 distinctive features : 區別性特徵
ontological : 本體論的 heterogeneous nature : 異質性
representation, interoperability, and expressivity : 表示性、互操作性、可擴展性
real-time : 實時 singular value decomposition (SVD) : 奇異值分解
Linked data semantic distance measurement :鏈接數據語義距離測量
incoming/outgoing links: 傳入/傳出鏈接
new entity : 新實體(新用戶/新商品)regulator : 調度器
query constructor : 查詢構造器
SPARQL query : SPARQL查詢(數據庫查詢命令) information miner : 信息礦工
0.Abstract
1.Introduction
推薦算法分類 → 協同過濾算法 → 數據稀疏/冷啓動 → LOD(Linked open data : 鏈接開源數據) → 解釋了一下相關概念:RDF\DBpedia(知識庫)\矩陣分解綜述 → 本文貢獻 → 後續文章內容安排
①將鏈接開源數據(LOD)與近鄰協同過濾推薦系統融合
②將鏈接開源數據(LOD)與矩陣分解相融合
③基於LOD的推薦系統框架是通用的
④Netflix和Movielens數據集上實驗結果較優
【文章觀點存在問題】
①推薦系統分類不妥
②知識庫會涉及用戶大量個人隱私數據(人口統計信息)
2.Related works
2.1 Baseline estimation
介紹了一些近鄰協同過濾推薦算法的基本操作:①均值預測填充 → ②用戶/商品偏執項預測填充(最小二乘優化) → ③奇異值分解(SVD) → 提出問題
【引出文章研究問題】
基於現有SVD的推薦系統並未使用語義信息和交互數據進行未知評分的預測和冷啓動問題的處理
2.2 Linked open data enabled recommendation system
介紹了推薦系統與鏈接開源數據有關的研究,並引出文章研究問題:①鏈接數據語義距離度量 → ②Resim方法 → ③分塊信息內容語義相似度(PICSS) → ④Legato框架 →⑤語言鏈接開放數據(LLOD) → ⑥SemiLD框架 → ⑦SocialLink → ⑧XOSM框架 → ⑨BROAD-RSI → 引出文章研究問題
【引出文章研究問題】
現存所有方法並未充分利用LOD中的語義信息來解決數據稀疏和冷啓動問題
3. Proposed approach: recommender system with Linked Open Data
提出了一種新的基於開放鏈接數據的矩陣分解(MF-LOD)系統,該系統改進了基於隱式反饋數據和基於鏈接開放數據相似性度量的矩陣分解模型,解決了協同過濾中的數據稀疏問題。另一方面,開發了基於LOD模型的推薦系統(RS-LOD),該系統利用LOD雲中項目或用戶的語義特徵來處理推薦中的冷啓動問題
3.1 LOD for cold start problem in CF (RS-LOD)
該部分主要描述了RS-LOD推薦系統的運作原理:①新實體(新用戶/新商品:new entity) → ②推薦系統接口(RS interface) → ③調度器(regulator) → ④查詢構造器(query constructor) →⑤SPARQL查詢(數據庫查詢語句) → ⑥LOD接口(LOD interface) → ⑦調度器(regulator) → ⑧信息礦工(information miner) → ⑨相似度計算(similarity calculation) → ⑩推薦列表(recommendation list)
3.2 Enhanced matrix factorization model for data saprsity