原创 Step by Step 改進樸素貝葉斯算法

引言如果你對naive bayes認識還處於初級階段,只瞭解基本的原理和假設,還沒有實現過產品級的代碼,那麼這篇文章能夠幫助你一步步對原始的樸素貝葉斯算法進行改進。在這個過程中你將會看到樸素貝葉斯假設的一些不合理處以及侷限性,從而瞭解爲什麼

原创 基於樸素貝葉斯的內容推薦算法

論文出處: http://www.cs.utexas.edu/~ml/papers/libra-sigir-wkshp-99.pdf引言這篇文章裏面將會詳細介紹基於多項式貝葉斯的內容推薦算法的符號以及術語,公式推導以及核心思想,學習如何從文

原创 CentOS6.5桌面版安裝VirtualBox提示錯誤/etc/init.d/vboxdrv setup

安裝步驟1.在VirtualBox主頁上面下載 VirtualBox-4.3-4.3.6_91406_el6-1.x86_64.rpm2.雙擊安裝3.安裝完成後選擇鏡像後安裝系統後將出現錯誤對話框並提示你運行/etc/init.d/vbox

原创 伯努利分佈詳解(包含該分佈數字特徵的詳細推導步驟)

Bernouli Distribution(中文翻譯稱伯努利分佈)該分佈研究的是一種特殊的實驗,這種實驗只有兩個結果要麼成功要麼失敗,且每次實驗是獨立的並每次實驗都有固定的成功概率p。概率公式可以表示爲  , x只能爲0或者1,即要麼成功要

原创 我的友情鏈接

51CTO博客開發

原创 Step by Step 改進樸素貝葉斯算法

引言如果你對naive bayes認識還處於初級階段,只瞭解基本的原理和假設,還沒有實現過產品級的代碼,那麼這篇文章能夠幫助你一步步對原始的樸素貝葉斯算法進行改進。在這個過程中你將會看到樸素貝葉斯假設的一些不合理處以及侷限性,從而瞭解爲什麼

原创 基於樸素貝葉斯的內容推薦算法

論文出處: http://www.cs.utexas.edu/~ml/papers/libra-sigir-wkshp-99.pdf引言這篇文章裏面將會詳細介紹基於多項式貝葉斯的內容推薦算法的符號以及術語,公式推導以及核心思想,學習如何從文

原创 CentOS6.5桌面版安裝VirtualBox提示錯誤/etc/init.d/vboxdrv setup

安裝步驟1.在VirtualBox主頁上面下載 VirtualBox-4.3-4.3.6_91406_el6-1.x86_64.rpm2.雙擊安裝3.安裝完成後選擇鏡像後安裝系統後將出現錯誤對話框並提示你運行/etc/init.d/vbox

原创 伯努利分佈詳解(包含該分佈數字特徵的詳細推導步驟)

Bernouli Distribution(中文翻譯稱伯努利分佈)該分佈研究的是一種特殊的實驗,這種實驗只有兩個結果要麼成功要麼失敗,且每次實驗是獨立的並每次實驗都有固定的成功概率p。概率公式可以表示爲  , x只能爲0或者1,即要麼成功要

原创 我的友情鏈接

51CTO博客開發

原创 利用LDA進行文本聚類(hadoop, mahout)

項目原理概述利用sqoop將數據從MySQL導入到HDFS中,利用mahout的LDA的cvb實現對輸入數據進行聚類,並將結果更新到數據庫中。數據流向圖如下mahout算法分析輸入數據格式爲<IntegerWritable, VectorW