基於鄰域的推薦算法

原創

2019-03-20 12:50

User-Based

用戶相似度：
$w_{uv} = \frac{|N(u) \cap N(v)|}{|N(u) \cup N(v)|}$
$w_{uv} = \frac{|N(u) \cap N(v)|}{\sqrt{|N(u)| |N(v)|}}$
建立物品-用戶倒排表，轉化爲用戶相似度矩陣：

def UserSimilarity(train):
        # build inverse table for item_users
        item_users = dict()
        for u, items in train.items():
             for i in items.keys():
                 if i not in item_users:
                     item_users[i] = set()
                 item_users[i].add(u)
        #calculate co-rated items between users
        C = dict()
        N = dict()
        for i, users in item_users.items():
             for u in users:
                 N[u] += 1
                 for v in users:
                     if u == v:
                         continue
                     C[u][v] += 1
        #calculate finial similarity matrix W
        W = dict()
        for u, related_users in C.items():
             for v, cuv in related_users.items():
                 W[u][v] = cuv / math.sqrt(N[u] * N[v])
		return W

UserCF下用戶 $u$ 對物品 $i$ 的感興趣程度， $S(u,k)$ 是和用戶 $u$ 相似度最接近的 $K$ 個用戶， $N(i)$ 是對物品 $i$ 有過行爲的用戶集合：
$p(u, i) = \sum_{v\in S(u,K) \cap N(i)}w_{uv}r_{vi}$
代碼實現：

def Recommend(user, train, W):
    rank = dict()
    interacted_items = train[user]
    for v, wuv in sorted(W[u].items, key=itemgetter(1), \
        reverse=True)[0:K]:
        for i, rvi in train[v].items:
             if i in interacted_items:
                 #we should filter items user interacted before
                 continue
             rank[i] += wuv * rvi
    return rank

改進用戶相似度計算公式：
$w_{uv} = \frac{|N(u) \cap N(v)|}{\sqrt{|N(u)| |N(v)|}}$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基於鄰域的推薦算法

User-Based

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

sm4加密工具類

Cache Blocking

打印隨機森林模型預測樣本的決策路徑

理解解釋器中的JIT機制

信息論（信息熵、KL散度、交叉熵以及互信息）

基於PyTorch的風格遷移

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結