原创 數據挖掘環境配置(一)JDK在ubuntu 16.04下的安裝配置

jdk在ubuntu 16.04下的安裝 1、下載jdk jdk-8u91-linux-x64.tar.gz http://download.ora

原创 大數據爬蟲基礎(三)Scrapy在ubuntu 16.04下的安裝

Scrapy ubuntu下安裝系統:ubuntu 16.04 no gui 依賴包及依賴包的依賴包: 下列的安裝步驟假定您已經安裝好下列程序:

原创 大數據基礎(三)Ubuntu下基於Hadoop 2.6.2的Mahout 0.12.1安裝和使用

Ubuntu下基於Hadoop 2.6.2的Mahout 0.12.1安裝和使用環境: Ubuntu Server 14.04.04 amd64 H

原创 數據挖掘算法(一)提高文本分類算法準確率和性能的10條建議

10 Tips to Improve your Text Classification Algorithm Accuracy and Performance 1.Eliminate Low Quality Features (Words

原创 大數據爬蟲基礎(三) MAVEN的安裝配置和使用(上)

環境: ubuntu server 14.04.04 amd64 jdk1.8 1. 安裝: http://www.jikexueyuan.com/course/571_4.html?ss=1 下載、解壓、M2_HOME、PATH mvn

原创 大數據基礎(二)hadoop, mave, hbase, hive, sqoop在ubuntu 14.04.04下的安裝和sqoop與hdfs,hive,mysql導入導出

hadoop, mave, hbase, hive, sqoop在ubuntu 14.04.04下的安裝2016.05.15 本文測試環境: had

原创 大數據爬蟲基礎(二)Redis在ubuntu 14.04.03下安裝

Redis安裝 環境: ubuntu 14.04.03 amd64 python 2.7.10 參考:http://www.360doc.com/c

原创 大數據基礎(一)openmpi,mpich,mpi4py在ubuntu 16.04下的安裝指南

安裝mpi4py的方法 直接pip install mpi4py不可取。 需要安裝以下依賴包: https://bitbucket.org/mpi4

原创 大數據基礎(四)Ubuntu sbt安裝和Spark下的使用

Ubuntu sbt安裝和Spark下的使用 環境: ubuntu server 14.04.04 amd64,hadoop2.6.2,scala 2.11.7,sbt 0.13.11,jdk 1.8一、安裝方法一: 下載tgz壓縮包 1

原创 安裝部署(三) openMQ安裝和使用

openMQ安裝和使用 windows 10 x64 jdk 1.7 1 下載 https://mq.java.net/downloads/index.html openmq5_1-binary-wind

原创 安裝部署(八) Hive+Sqoop安裝部署和使用

Hive+Sqoop安裝haddoop 2.7.2 spark 2.0.0 zookeeper 3.4.8 kafka 0.10.0.0 hbase 1.2.2 jdk1.8.0_101 ubuntu 1

原创 安裝部署(五)Ubuntu系統監控(一)

nmon 話不多說,不知道的百度吧 apt-get install nmon 快捷鍵:c cpu  m memory  d disk  n network  t top references: ht

原创 安裝部署(十) Ubuntu下安裝R和RMySQL驅動

Ubuntu下R安裝MySQL驅動 ubuntu 14.04 參考: http://blog.fens.me/r-mysql-rmysql/ 正常情況下: install.packages("RMySQL

原创 安裝部署(六) Kafka集羣安裝部署以及Producer和Consumer的JAVA代碼測試

Kafka集羣安裝部署以及Producer和Consumer的JAVA代碼測試 kafka scala2.11_0.10.0.0 ubuntu 14.04.04 x64 hadoop 2.7.2spark

原创 大數據基礎(六) Matlab R2015b MDCE分佈式計算環境搭建

環境: ubuntu desktop 14.04.04 x64 jdk 1.7 安裝步驟如下: 參考:http://www.jianshu.com/p/f0cefc737dda1. sudo mkdir -p /mnt/tmp sudo