原创 推薦系統筆記二 Personal rank算法

Graph-based推薦傳統做法是構建二元圖(bipartite),分爲user和item兩個node集合,user-item的interaction構建兩個集合之間的連線,見下圖,其中圓框是三個user,方形框是四個item。

原创 強化學習筆記三 Monte Carlo Method & Temporal-Difference Method

之前筆記二中介紹了求解MDP的model based方法,本篇筆記介紹兩種model-free方法,Monte Carlo(MC) 和 Temporal-Difference(TD)。 model-free methods 先說說

原创 Latex公式編輯

對常用latex公式編輯做一個備忘錄 調用數學相關的包 \usepackage[namelimits]{amsmath} %數學公式 \usepackage{amssymb} %數學公式 \usepacka

原创 調參筆記:神經網絡收斂問題

最近網絡一直有收斂的問題,懷疑是梯度在訓練的時候爆炸或歸零導致分類器對evaluate集全0或全1預測。 第一個問題是出現accuracy固定在baseline上,無法提高 原因: tf的share embedding colu

原创 推薦系統論文閱讀 Why Does Collaborative Filtering Work?

這篇是一篇比較早的利用圖來研究推薦系統的文章(2005):Why Does Collaborative Filtering Work? — Recommendation Model Validation and Selection

原创 python pickle讀取,儲存數據

def picklesave(obj,file): ff = open(file,'wb') pickle.dump(obj,ff) ff.close() def pickleload(file):

原创 強化學習筆記四 DP, MC, TD小結

前兩篇介紹了三種RL方法,DP,MC和TD,本篇進行一個總結和對比。 Backup 先來看看backup的區別: DP MC TD Bootstrapping & sampling Bootstrapping指更新中包含估計

原创 論文閱讀 Multi-Task Deep Neural Networks for Natural Language Understanding

這是今年arXiv上Microsoft Research的一篇文本embedding的文章,原文在Multi-task DNN。 這篇文章的思路很簡單,在BERT的基礎上,用multi-task learning對embeddin

原创 url open error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed

Python3 在下載數據集的時候需要多驗證一次證書,會導致以下錯誤: URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify fa

原创 極大極小搜索算法 minimax search

minimax search 設計象棋等AI模型時常常需要使用博弈論的思想,minimax search就是一種基於當前狀態推測出使我方最有利而對方最不利的行動,在實際模型中需要考慮狀態函數,樹的深度,時間成本等等因素,這裏只講一

原创 tensorflow筆記 cross entropy loss

交叉熵損失函數是模型中非常常見的一種損失函數,tensorflow中有一個計算交叉熵的函數:tf.nn.sigmoid_cross_entropy_with_logits,也可以調用keras中的函數: tf.keras.back

原创 聯邦學習論文閱讀:Variational Federated Multi-Task Learning

這篇文章是探索聯邦學習的框架下的多任務學習,稍後會整理一下之前的那篇multi task learning to be continued

原创 37 Reasons why your Neural Network is not working

最近網絡一直有收斂的問題,懷疑是梯度在訓練的時候爆炸或歸零導致分類器對evaluate集全0或全1預測。 This blog gives a quick step to check the model: https://blog.

原创 聯邦學習論文閱讀:Secure Federated Matrix Factorization

這是六月剛剛掛上arXiv的文章,楊老師學生的工作 link 代碼 摘要 這篇文章提出了聯邦化的矩陣分解算法,作者發現傳梯度也會泄露信息,所以利用同態加密來進一步保證用戶數據的隱私性。 框架 基本框架和federated coll

原创 聯邦學習相關資料

聯邦學習相關的博客,論文以及PPT,持續更新 個人能力有限,歡迎補充~ Blog Google16年解釋聯邦學習用於輸入預測應用的blog:Federated Learning: Collaborative Machine