台部落thormas1996

Graph-based推薦傳統做法是構建二元圖（bipartite），分爲user和item兩個node集合，user-item的interaction構建兩個集合之間的連線，見下圖，其中圓框是三個user，方形框是四個item。

2020-06-16 12:01:33

之前筆記二中介紹了求解MDP的model based方法，本篇筆記介紹兩種model-free方法，Monte Carlo(MC) 和 Temporal-Difference(TD)。 model-free methods 先說說

2020-06-16 12:01:33

對常用latex公式編輯做一個備忘錄調用數學相關的包 \usepackage[namelimits]{amsmath} %數學公式 \usepackage{amssymb} %數學公式 \usepacka

2020-06-16 12:01:33

最近網絡一直有收斂的問題，懷疑是梯度在訓練的時候爆炸或歸零導致分類器對evaluate集全0或全1預測。第一個問題是出現accuracy固定在baseline上，無法提高原因： tf的share embedding colu

2020-06-16 12:01:33

這篇是一篇比較早的利用圖來研究推薦系統的文章（2005）：Why Does Collaborative Filtering Work? — Recommendation Model Validation and Selection

2020-06-16 12:01:33

def picklesave(obj,file): ff = open(file,'wb') pickle.dump(obj,ff) ff.close() def pickleload(file):

2020-06-16 12:01:33

前兩篇介紹了三種RL方法，DP，MC和TD，本篇進行一個總結和對比。 Backup 先來看看backup的區別： DP MC TD Bootstrapping & sampling Bootstrapping指更新中包含估計

2020-06-16 12:01:33

這是今年arXiv上Microsoft Research的一篇文本embedding的文章，原文在Multi-task DNN。這篇文章的思路很簡單，在BERT的基礎上，用multi-task learning對embeddin

2020-06-16 12:01:22

Python3 在下載數據集的時候需要多驗證一次證書，會導致以下錯誤： URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify fa

2020-06-16 12:01:22

minimax search 設計象棋等AI模型時常常需要使用博弈論的思想，minimax search就是一種基於當前狀態推測出使我方最有利而對方最不利的行動，在實際模型中需要考慮狀態函數，樹的深度，時間成本等等因素，這裏只講一

2019-10-25 21:17:45

交叉熵損失函數是模型中非常常見的一種損失函數，tensorflow中有一個計算交叉熵的函數：tf.nn.sigmoid_cross_entropy_with_logits，也可以調用keras中的函數： tf.keras.back

2019-07-09 21:29:18

這篇文章是探索聯邦學習的框架下的多任務學習，稍後會整理一下之前的那篇multi task learning to be continued

2019-07-04 20:05:21

最近網絡一直有收斂的問題，懷疑是梯度在訓練的時候爆炸或歸零導致分類器對evaluate集全0或全1預測。 This blog gives a quick step to check the model: https://blog.

2019-07-02 20:41:48

這是六月剛剛掛上arXiv的文章，楊老師學生的工作 link 代碼摘要這篇文章提出了聯邦化的矩陣分解算法，作者發現傳梯度也會泄露信息，所以利用同態加密來進一步保證用戶數據的隱私性。框架基本框架和federated coll

2019-06-24 21:02:32

聯邦學習相關的博客，論文以及PPT，持續更新個人能力有限，歡迎補充~ Blog Google16年解釋聯邦學習用於輸入預測應用的blog：Federated Learning: Collaborative Machine

2019-06-10 23:51:51