原创 奇異值分解SVD實現與應用

SVD是一種提取信息的強大工具,通過SVD實現我們能夠用小的多的數據集來表示原始數據集,這樣做實際就是去除噪聲和冗餘信息。 隱性語義索引 SVD最早應用就是信息檢索,我們稱利用SVD方法爲隱性語義索引(LSI),在LSI中一個矩陣是由文檔

原创 接口實現鬆耦合

來自java編程思想9.3 完全解耦 只要一個方法操作是類而非接口,那麼你就只能使用這個類及其子類。如果你想要將這個方法應用到不在此繼承結構中的某個類,那麼你就達不到目的。接口可以很大程度放寬這種限制,因此使用接口而非繼承使得我們可以編寫

原创 java 容器中排序算法的源碼實現分析(京東電話面試)

排序算法源碼剖析 首先在eclipse 中使用Ctrl+鼠標左鍵查看源碼發現 source not found ,出現這個問題很簡單就是源碼沒有連接。把JDK 安裝時的src.zip連接就可以 具體參考百度經驗:http://jingya

原创 C語言助教題目代碼部分

題8000022012,求一個整數任意次方的最後三位數。 #include <stdio.h> #include <stdlib.h> int main() { int m,n; scanf("%d %d",&m,&n)

原创 本地 push 到github 每次都需要輸入用戶密碼問題

在github.com上 建立了一個小項目,可是在每次push  的時候,都要輸入用戶名和密碼,很是麻煩,用戶體驗很差,後來發現其實是自己沒有使用正確的方式。 有兩種方式push ,如何查看是哪種方式了? git remote -v 指令

原创 scikit包遇到的問題。

因爲需要調用scikit包中Adaboost算法,我們需要設定一個基礎分類器,因爲開始不知道隨便設定一些分類器,出現錯誤信息: TypeError: fit() got an unexpected keyword argument 'sa

原创 Hadoop 實現kmeans 算法

關於kmeans說在前面:kmeans算法有一個硬性的規定就是簇的個數要提前設定。大家可能會質疑這個限制是否影響聚類效果,但是這種擔心是多餘的。在該算法誕生的這麼多年裏,該算法已被證明能夠廣泛的用於解決現實世界問題,即使簇個數k值是次優的

原创 python 賦值、深淺拷貝、作用域

python中的賦值語句 python中關於對象複製有三種類型的使用方式,賦值、淺拷貝與深拷貝。在 python 中賦值語句總是建立對象的引用值,而不是複製對象。因此,python 變量更像是指針,而不是數據存儲區域。如下圖所示:

原创 SVD綜述和Mahout中實現

基本介紹 伴隨的電商業務蓬勃發展,推薦系統也受到了格外重視,在通常電商系統中都是採用基於CF(Collaborative filtering)算法原型來做的。該算法是基於這樣基本假設:people who agreed in the pa

原创 推薦系統實踐讀書筆記與思考

推薦系統評測 一個網站3各參與方,用戶、網站、內容提供方,好的推薦系統目標就在增加用戶與網站互動,提高網站收入(這是公司最關注的),所以在推薦系統中需要綜合考慮三方的利益。 在進行推薦時要注重用戶體驗並且也要考慮相關商家的利益,最終能使得

原创 MapReduce 矩陣乘法

一、對樸素簡單直接方法 把m*n 和n*l的矩陣A和B相乘,這估計是最容易想到的方法了: 把A(m*n)的元素,每個發送l次,把B(n*l)的元素每個發送m次。將發送到一起的數據相乘求和,得到最後的結果。 優點:在知道座標的情況

原创 Combination Sum | && || Leetcode

https://leetcode.com/problems/combination-sum/ Given a set of candidate numbers (C) and a target number (T), find all

原创 基於user的推薦系統--以Mahout爲實例

基於用戶的協同過濾是推薦系統中最古老的算法,而且這個算法思路也是非常直接,通過找某個user類似的user喜好進行推薦。 具體實現流程如下: u 代表一個user ,上述流程是一個最樸素的基於用戶的推薦流程。但是這個在實際當中效率太低下

原创 Canopy聚類算法與Mahout中的實現

前面提到的kmeans 算法需要提前設定簇的個數,我們也可以根據數據進行簡單簇數目估計,但是有一類稱爲近似聚類算法技術可以根據給定數據集估計簇的數量以及近似的中心位置,其中有一個典型算法就是canopy生成算法。 Mahout中kmean

原创 C語言重要知識點回顧

太久沒有看C語言相關知識了,開始要整理回顧一些重點知識點啦,因爲各大公司筆試還是有許多C語言相關的題,做個複習。 const 關鍵字與指針修飾使用 普通指針使用: //普通指針使用,我們通過 i 或者 p 指針都能改變變量值 void