原创 Ubuntu下搭建python數據分析環境

本文記錄一下Ubuntu下安裝python關於數據處理的各種包,安裝的方法都非常簡單,直接使用apt-get 1.ipython工具 ipython 是一個 python 的交互式 shell,比默認的python shell 好用得多

原创 Scipy中的稀疏矩陣--介紹

稀疏矩陣介紹 1 介紹 (稠密)矩陣是: 數學對象存儲二維數組的數據結構  重要特質: 所有元素內存一次性分配,在Numpy ndarray中通常是一個連續的塊快速訪問單個元素1.1 爲什麼使用稀疏矩陣? 內存增長速度爲n^2例子

原创 (轉)關於推薦系統中的特徵工程

轉自http://phunters.lofter.com/    在多數數據和機器學習的blog裏,特徵工程 Feature Engineering 都很少被提到。做模型的或者搞Kaggle比賽的人認爲這些搞feature工作繁

原创 pip安裝使用詳解

本文地址:http://www.ttlsa.com/python/how-to-install-and-use-pip-ttlsa/ pip類似RedHat裏面的yum,安裝軟件非常方便。本節詳細介紹pip的安裝、以及使用方法。

原创 (轉)解析智能推薦系統開發中十大關鍵要素

 亞馬遜的CEO Jeff Bezos曾經說過,他的夢想是“如果我有100萬個用戶,我就要爲他們做100萬個亞馬遜網站”。智能推薦系統承載的就是這個夢想,即通過數據挖掘技術,爲每一個用戶實現個性化的推薦結果,讓每個用戶更便捷的獲取信息。

原创 記錄一些排序算法

記錄一些排序算法的c代碼 插入排序O(n^2) void InsertSort(int *a) { int i,j,key; for(j=2;j<=a[0];j++) { key=a[j]; i=j-1; while(

原创 java學習心得1

爲了學習J2EE的技術,現在在惡補java se的東西,先從最基礎的學起,教材選了李剛的那本《瘋狂java講義》 第一章是java語言概述,介紹了java語言的特點,java環境的搭建和一些java程序的基本原則。 第二章大概介紹了一下o