原创 一些機器學習和推薦系統的資料

大數據/數據挖掘/推薦系統/機器學習相關資源Share my personal resources 視頻大數據視頻以及講義http://pan.baidu.com/share/link?shareid=

原创 TF-IDF 算法

    近來寫論文需要抽取文檔的主題和關鍵詞,所以研究了一些關於抽取文檔關鍵詞以及計算文本相似度的一些算法。 TF-IDF是在抽取文檔關鍵詞,文檔分類等領域比較經典的算法,我在很多本書中都看到過TF-IDE得身影,比如吳軍的《數學之美》。

原创 Java筆記之抽象

抽象 抽象是java裏比較重要的一個概念,一個類 所有含有抽象方法的類都需要被聲明爲抽象類,用abstract關鍵詞來聲明抽象類和抽象方法。所有聲明的抽象類必須被繼承纔有意義。 public abstract class Dog{

原创 Servlet快速入門

Servlet快速入門 一、tomcat 目錄       Servlet顧名思義,是服務器上運行的小程序。小程序的運行需要一定的運行環境,也就是WEB服務器,web容器多種多樣,但目前比較常用的是tomcat。所以首先要下載tomcat

原创 基於用戶的協同過濾算法

協同過濾算法在推薦系統領域佔有及其重要的地位,協同過濾算法的出現甚至標誌了智能推薦的出現。協同過濾算法大體上分爲兩類:基於用戶的協同過濾和基於物品的協同過濾。近幾年出現的對協同過濾算法的改進,大部分都是基於這兩種算法。筆者最近學習了基於用

原创 Java虛擬機(虛擬機內存分析)

java虛擬機是java程序員的操作系統,所以掌握java虛擬機對於java程序員來說很有必要。在接下來的時間裏,我將重點總結和分析java虛擬機的相關知識。參看書籍選擇《java虛擬機規範》和周志明老師的《深入理解java虛擬機》,這兩

原创 java學習筆記之接口

1、接口        面向對象的思想是將所有的事物都看作一個對象,對象的複雜性也導致了我們生活的多樣性,但多樣性之中含有共性。比如人有很多種,有學生、有老師、有醫生。但所有的人正常人都有他們的共性,比如會跑步,會說話,會思考。所以跑步、

原创 從最大似然到EM算法淺解

從最大似然到EM算法淺解         本文轉載自:http://blog.csdn.net/zouxy09/article/details/8537620        機器學習十大算法之一:EM算法。能評得上十大之一,讓人聽起

原创 dom4j快速入門

package dom4j; import java.io.File; import java.io.FileOutputStream; import java.io.FileWriter; import java.io.Output

原创 各大知名網站的推薦系統

1. 前言        隨着互聯網技術和社會化網絡的發展,每天有大量包括博客,圖片,視頻,微博等等的信息發佈到網上。傳統的搜索技術已經不能滿足用戶對信息發現的需求,原因有多種,可能是用戶很難用合適的關鍵詞來描述自己的需求,也可能用戶

原创 機器學習經典書籍小結

博客第一篇文章[1]是轉載的,也算是開始寫博客不經意的表露了自己對機器學習的興趣吧!那篇文章總結了機器學習的一些經典算法的論文與數學基礎理論的一些書籍,對於開始學習機器學習的話恐怕太過深入,正好最近在買書,看了很多經典書籍的總結與評論,我