-
Word2Vec 算法学习
word2vec 中的数学原理详解
word2vec详解
Skip-Gram模型理解
CBOW模型 -
Text-CNN 算法模型
Text-CNN文本分类
项目参考 -
推荐算法
召回算法和业界最佳实践
Match 模块
FM模型
重排序-CTR-Wide&Deep模型
Wide&Deep模型
解读阿里的Deep Image CTR Model
推荐流程设计
DeepFM在贝壳房源详情页推荐场景的实践
工作重点:
数据的基本处理、转换、清洗等
在线及离线的数据处理
特征工程(特征选择,特征降维、特征编码,特征组合等)
算法(算法选择及调参、优化等)
存储层几个数据库的作用:
hive:存储中间及结果数据,数据分析,主要用于离线层使用。
hdfs: 训练集数据保存,model保存
redis:kv缓存数据库,推荐结果写入
hbase : 海量列存储kv数据库,写入各维度特征值,供在线调用