原创 關聯規則挖掘 - 概述

一 定義 根據韓家煒等觀點,關聯規則定義爲: 假設是I={i1,i2...im}項的集合。給定一個交易數據庫D,其中每個事務(Transaction)t是 I 的非空子集,即,每一個交易都與一個唯一的標識符TID(Transaction

原创 走進lucene - 創建索引、檢索

看過王老師的信息檢索導論,一直想學lucene,看看從實現的角度,搜索引擎是如何工作的。 正好工作中用到一點lucene,嘗試使用,爲後續分析做好準備。 截止到現在,lucene已經更新到4.8了,適配Java8,並做了很多封裝。 自己會

原创 關聯規則挖掘 - Apriori算法

1 Apriori 介紹 Apriori 算法使用頻繁項集的先驗知識,使用一種稱作逐層搜索的迭代方法, k項集用於探索 (k+1) 項集。 首先,通過掃描數據庫,累積每個項的計數,並收集滿足最小值尺度的項,找出頻繁 1 項集的集合,該集合

原创 A Large set of Machine Learning Resources for Beginners to Mavens

轉自:我愛機器學習(52ml.net) » 《A Large set of Machine Learning Resources for Beginners to Mavens》 Machine Learning 101: I.

原创 線性判別分析(LDA), 主成分分析(PCA)

轉自 http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-and-pca-machine-learning.html 前言:     第二篇的文章中談到,和部門老大一寧

原创 protobuf使用簡介

1 protobuf介紹 Protobuf全稱Google Protocol Buffershttp://code.google.com/p/protobuf結構化數據存儲格式(xml, json)用於通信協議、數據存儲等高效的序列化和反

原创 探索推薦引擎內部的祕密:深入推薦引擎相關算法 - 聚類

這是探索推薦引擎內部的祕密的最後部分,講述了聚類算法。 轉自:https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/ 智能推薦大都基於海量數據的計算和處理,然

原创 SIFT算法詳解

非圖像處理領域,只是好奇,想了解下。 轉自:http://blog.csdn.net/zddblog/article/details/7521424 尺度不變特徵變換匹配算法詳解 Scale Invariant Feature Tran

原创 AWK 簡明教程

轉自:酷殼,http://coolshell.cn/articles/9070.html 有一些網友看了前兩天的《Linux下應該知道的技巧》希望我能教教他們用awk和sed,所以,出現了這篇文章。我估計這些80後的年輕朋友可能對aw

原创 Java中super關鍵字的用法及示例

主要是由Hadoop中的函數想到的,以前對super不太明白,寫了幾段代碼搞懂了。 @Override protected void setup(Context context) throws IOException,     Inte

原创 atoi函數的實現

請實現函數int atoi(const char *nptr)) 函數說明: atoi會掃描參數nptr字符串,跳過前面的空格字符,遇到數字或正負符號開始做轉換,直至遇到非數字或字符串結束時('\0')結束轉換,並將結果返回。 不同人能

原创 用 WEKA 進行數據挖掘,第 1 部分: 簡介和迴歸

轉自:http://www.ibm.com/developerworks/cn/opensource/os-weka1/ WEKA 數據挖掘絕非大公司的專有,也不是多昂貴的軟件。實際上,有一種軟件可以實現那些價格不菲的軟件所能實現

原创 libMF源碼分析

轉自:http://bookc.github.io/2014/05/26/libmf-comments-in-chinese/ libMF是由臺灣大學林智仁老師實驗室開發的,一個用於推薦系統領域的矩陣分解開源庫。矩陣分解通常用於協同過濾方

原创 機器學習中的數學(2)-線性迴歸,偏差、方差權衡

轉自 - http://www.cnblogs.com/LeftNotEasy/archive/2010/12/19/mathmatic_in_machine_learning_2_regression_and_bias_variance

原创 使用Ant打包java程序

Ant是一個構建工具,它可以幫助我們將項目開發過程中需要完成的各種步驟組織起來,通過一個簡易的方式來構建整個項目。 一些典型的任務是:編譯java源代碼、運行java程序、拷貝文件或目錄、將編譯完成的類打包等等。 一、 安裝與配置 下載A