原创 數據挖掘中的大數據集

Data repositories AWS (Amazon Web Services) Public Data Sets, provides a centralized repository of public data sets t

原创 rpm:RPM should not be used directly install RPM packages, use Alien instead!

http://www.dedevip.org/2406-rpm-should-not-be-used-directly-install-rpm-packages-use-alien-instead-.html Do not instal

原创 一步步教你Hadoop多節點集羣安裝配置

1、集羣部署介紹 1.1 Hadoop簡介  Hadoop是Apache軟件基金會旗下的一個開源分佈式計算平臺。以Hadoop分佈式文件系統HDFS(Hadoop Distributed Filesystem)和MapReduce(Go

原创 【決策樹】— C4.5算法建立決策樹JAVA練習

轉載出處:http://www.cnblogs.com/lixusign/archive/2012/06/13/2548124.html 以下程序是我練習寫的,不一定正確也沒做存儲優化。有問題請留言交流。轉載請掛連接。 當前的屬

原创 一步步教你Hadoop多節點集羣安裝配置

1、集羣部署介紹 1.1 Hadoop簡介  Hadoop是Apache軟件基金會旗下的一個開源分佈式計算平臺。以Hadoop分佈式文件系統HDFS(Hadoop Distributed Filesystem)和MapReduce(Go

原创 LR(邏輯迴歸)

本系列文章用於彙集知識點,查漏補缺,面試找工作之用。數學公式較多,解釋較少。 1.假設 2.sigmoid函數: 3.假設的含義: 4.性質: 5.找一個凸損失函數 6.可由最大似然估計推導出 單個樣本

原创 Linux chmod命令修改文件與文件夾權限的命令附實例

語法:chmod [who] [+ | - | =] [mode] 文件名 命令中各選項的含義爲 u 表示“用戶(user)”,即文件或目錄的所有者。 g 表示“同組(group)用戶”,即與文件屬主有相同組ID的所有用戶。 o 表

原创 (EM算法)The EM Algorithm

EM是我一直想深入學習的算法之一,第一次聽說是在NLP課中的HMM那一節,爲了解決HMM的參數估計問題,使用了EM算法。在之後的MT中的詞對齊中也用到了。在Mitchell的書中也提到EM可以用於貝葉斯網絡中。 下面主要介紹EM的整個

原创 在ubuntu中配置SSH(解決connect to host localhost port 22: Connection refused問題)

Ubuntu下測試ssh時使用ssh localhost 命令,出現錯誤提示connect to host localhost port 22:Connection refused   造成這個錯誤的原因可能是ssh-server未

原创 對線性迴歸,logistic迴歸和一般迴歸的認識

【轉載時請註明來源】:http://www.cnblogs.com/jerrylead      JerryLead      2011年2月27日      作爲一個機器學習初學者,認識有限,表述也多有錯誤,望大家多多批評指正。

原创 linux服務器之間傳輸文件的幾種方式

1. scp 【優點】簡單方便,安全可靠;支持限速參數 【缺點】不支持排除目錄 【用法】 scp就是secure copy,是用來進行遠程文件拷貝的。數據傳輸使用 ssh,並且和ssh 使用相同的認證方式,提供相同的安全保證 。

原创 GraphLab數據集

GraphLab  dataset http://graphlab.org/downloads/datasets/ 點贊 收藏 分享 文章舉報 _張小凡 發佈了2 篇原創文章

原创 BigDecimal類

轉載出處:http://blog.163.com/quanquan127@126/blog/static/6884772520126111013580/   前面介紹float、double兩種基本浮點類型時已經指出,這兩個基本類

原创 公開大數據集

https://delicious.com/pskomoroch/dataset  http://wiki.gephi.org/index.php/Datasets http://stackoverflow.com/question

原创 Java Collection

文章出處:http://skyuck.iteye.com/blog/526358 在 Java2中,有一套設計優良的接口和類組成了Java集合框架Collection,使程序員操作成批的數據或對象元素極爲方便。這些接口和類有很多對抽