原创 sklearn特徵選擇和分類模型

sklearn特徵選擇和分類模型 數據格式: 這裏,原始特徵的輸入文件的格式使用libsvm的格式,即每行是label index1:value1 index2:value2這種稀疏矩陣的格式。   sklearn中自帶了很多種特徵選

原创 git配置ssh密鑰

git配置ssh密鑰 如果主機(當前登錄用戶)之前沒有git賬號,即添加第一個git賬號,並配置ssh密鑰時, 按照如下的步驟: 1 cd  ~/.ssh 2 ssh-keygen -t rsa -C 'liulian@gmail.

原创 一天一段scala代碼(十)

一天一段scala代碼(十)        爲了更好的駕馭spark,最近在學習scala語言特性,主要看《快學scala》,順便把一些自己認爲有用的代碼記下來。 package examples //特質的基本使用

原创 python多線程讀取同一個文件

python多線程讀取同一個文件 多線程讀取同一個文件,要求不能重複,不能遺漏。 最開始嘗試了一種方法(後來實踐證明是無效的) 主線程分配給每個讀線程需要讀取文件中哪些行, 比如線程1讀取1-10行,線程2讀取11-30行。 然後每個

原创 spark一些入門資料

spark一些入門資料 A Scala Tutorial for Java Programmers http://docs.scala-lang.org/tutorials/scala-for-java-programmers.htm

原创 linger博客原創性博文導航

linger博客原創性博文導航 http://blog.csdn.net/lingerlanlan 大學研究遊戲外掛技術開始了此博客,斷斷續續寫了些博文。後來,開始機器學習和深度學習的研究工作,由於喜歡和熱愛,業餘時間也經常性學習,並寫

原创 建QQ羣作爲大家技術交流的平臺

建個QQ羣作爲大家技術交流的平臺 最近有很多讀者來問我關於caffe的問題,由於我不搞caffe很久了,所以難以高效回答大家的問題。 因此,建QQ羣作爲大家技術交流的平臺。 深度學習交流羣:281372399 機器學習,數據挖掘,推薦

原创 word2vector學習筆記(一)

word2vector學習筆記(一)  最近研究了一下google的開源項目word2vector,http://code.google.com/p/word2vec/。 其實這玩意算是神經網絡在文本挖掘的一項成功應用。 本文是看了論

原创 deep learning實踐經驗總結

最近拿caffe來做圖片分類,遇到不少問題,同時也吸取不少教訓和獲得不少經驗。 先看例子再總結經驗。 這是一個2類分類器,分的是條紋衣服和純色衣服。 先看幾張圖片。 條紋衣服:   純色衣服: 肉眼也很容易辨認出來。 訓練出

原创 ALS矩陣分解推薦模型

ALS矩陣分解推薦模型 其實通過模型來預測一個user對一個item的評分,思想類似線性迴歸做預測,大致如下 定義一個預測模型(數學公式), 然後確定一個損失函數, 將已有數據作爲訓練集, 不斷迭代來最小化損失函數的值, 最終確定參數

原创 Tensorflow入門:數據結構和編程思想

Tensorflow入門:數據結構和編程思想 引言: 最近tensorflow很火,看到國內都有不少人開始玩起來了,自己最近有些想法想玩玩,於是開始入門搞一下,因爲自己只有一個臺式電腦,於是就裝了個cpu版的tensorflow,安裝過

原创 SVD推薦算法(二)

SVD推薦算法(二) 這次講解的是model-based的SVD推薦算法。 跟ALS推薦算法一樣,都是矩陣分解的推薦算法,只不過求解的方式不同而已。   假如評分矩陣是R,那麼我們希望擬合這樣一個模型 R=U*M 其中U是user特徵

原创 deep learning實踐經驗總結2--準確率再次提升,到達0.8,再來總結一下

deep learning實踐經驗總結2 最近拿caffe來做圖片分類,遇到不少問題,同時也吸取不少教訓和獲得不少經驗。 這次拿大擺裙和一步裙做分類, 多次訓練效果一直在0.7,後來改動了全鏈接層的初始化參數。高斯分佈的標準差由0.

原创 word2vec源碼解析之word2vec.c

word2vec源碼解析之word2vec.c 最近研究了一下google的開源項目word2vector,http://code.google.com/p/word2vec/。 其實這玩意算是神經網絡在文本挖掘的一項成功應用

原创 隱性反饋行爲數據的協同過濾推薦算法

隱性反饋行爲數據的協同過濾推薦算法 《Collaborative Filtering for Implicit Feedback Datasets》論文筆記 本文是我閱讀《CollaborativeFiltering for Impl