原创 LibFM使用手冊中文版

英文版原文:http://www.libfm.org/libfm-1.42.manual.pdf 自己翻譯 libFM 1.4.2 - 指南 Steffen Rendle [email protected] http://www.libf

原创 推薦算法學習-SVM,RSVM,ASVM,SVDPP學習公式推導

轉載請聲明出處http://blog.csdn.net/zhongkejingwang/article/details/43083603                                下面開始介紹SVD算法,假設存在

原创 【問題】ValueError: numpy.dtype has the wrong size, try recompiling解決

[問題]使用pandas時遇到ValueError: numpy.dtype has the wrong size, try recompiling [原因] 這是因爲 Python 包的版本問題,例如安裝了較舊版本的 Numpy,但安裝

原创 數據挖掘學習-準備篇-python編輯

模塊的導入: 模塊位置          把寫的script1放在我們安裝Python的位置: 然後開始-運行-python:import script1 10. import,from 和 reload 模塊只可以導入一

原创 數據挖掘學習-準備篇-python基礎

python科學計算 1.使用python內置數據集 from sklearn import datasets iris = datasets.load_iris() >>> print(iris.data) [[ 0.

原创 推薦算法學習-資料整理

1.推薦系統經典論文文獻及業界應用 2.LRSLibrary 64個低秩+稀疏矩陣/張量分解的算法庫 加長版49條 http://t.cn/R7eXvdJ 3.一條廣告含用戶,廣告和查詢三種信息,可規約爲多視角x=(x1,x2,x

原创 特徵工程——categorical特徵 和 continuous特徵

看到有些介紹,“特徵分爲categorical特徵 和 continuous特徵“不解,查資料得 單個原始特徵(或稱爲變量)通常屬於以下幾類之一: 連續(continuous)特徵;無序類別(categorical)特徵;有序類別(o

原创 數據挖掘學習-準備篇-數據集

1.Recsys2013 Yelp https://www.kaggle.com/c/yelp-recsys-2013/data https://www.yelp.com/dataset_challenge/dataset 訓練集= y

原创 關於Kdd cup

原博:http://blog.csdn.net/cserchen/article/details/38398917還有其他類型 kaggle上近一段時間數據挖掘競賽的獲獎隊伍的源代碼,對掌握相應的數據挖掘技術很有幫助 1.Kaggl

原创 特徵工程——特徵分類及不同類特徵的處理方式

特徵分類 對特徵進行分類,對於不同的特徵應該有不同的處理方法。 根據不同的分類方法,可以將特徵分爲 (1)Low level特徵和High level特徵。 Low level特徵——較低級別的特徵,主要是原始特徵,不需要或者需要非常

原创 特徵工程——推薦系統裏的特徵工程

原文:推薦系統裏的特徵工程 個性化推薦系統 Personalized recommender system 比其他的機器學習方法更依賴特徵工程,所以我拿它來當作問題的背景,結合我之前做過的一個推薦系統裏相關經驗來說說特徵工程具體是個什麼東

原创 python-加載數據集

import numpy as np import os import pandas as pd import csv def loadData(): data_filename=os.path.join(os.path.ex

原创 python語法基礎-cPickle.dump使用

在python中,一般可以使用pickle類來進行python對象的序列化,而cPickle提供了一個更快速簡單的接口 cPickle可以對任意一種類型的python對象進行序列化操作,比如list,dict,甚至是一個類的對象等。而所謂

原创 推薦算法學習-推薦系統老司機的十條經驗

推薦系統老司機的十條經驗節選 原文地址:http://geek.csdn.net/news/detail/124262 作者:陳開江@刑無刀,金融科技公司天農科技CTO,曾任新浪微博資深推薦算法工程師,考拉FM算法主管,先後負責微博反垃圾

原创 推薦算法工程

原文見:http://www.cnblogs.com/flclain/p/4211685.html 總結歸納爲: 事實上搞推薦的工作不等於 import IBCF 或者 import time SVD++ import tensor啊 做