-
Word2Vec 算法學習
word2vec 中的數學原理詳解
word2vec詳解
Skip-Gram模型理解
CBOW模型 -
Text-CNN 算法模型
Text-CNN文本分類
項目參考 -
推薦算法
召回算法和業界最佳實踐
Match 模塊
FM模型
重排序-CTR-Wide&Deep模型
Wide&Deep模型
解讀阿里的Deep Image CTR Model
推薦流程設計
DeepFM在貝殼房源詳情頁推薦場景的實踐
工作重點:
數據的基本處理、轉換、清洗等
在線及離線的數據處理
特徵工程(特徵選擇,特徵降維、特徵編碼,特徵組合等)
算法(算法選擇及調參、優化等)
存儲層幾個數據庫的作用:
hive:存儲中間及結果數據,數據分析,主要用於離線層使用。
hdfs: 訓練集數據保存,model保存
redis:kv緩存數據庫,推薦結果寫入
hbase : 海量列存儲kv數據庫,寫入各維度特徵值,供在線調用