原创 數據預處理demo

R筆記: #step(1): Reading data txt=readLines("Data_Hw2.txt") #readLines: when the rows in a data files are not unifor

原创 R筆記(繪圖)

R筆記: setwd("F:\\R基礎") getwd() #R繪圖示例 demo(graphics) #二維 demo(persp) #三維 #####1.繪圖區域分割##### #函數par() #首先,準備繪圖數據:從

原创 MySQL彩票分析

Mysql 彩票分析實例 create database CP1; #創建數據庫 use cp1; # drop table TableRaw; # 創建表 create table if not exists Table

原创 聚類(R)

####聚類#### ##隨機產生三個簇點 c1<-cbind(rnorm(100,2,1),rnorm(100,2,2)) c2<-cbind(rnorm(80,3,1),rnorm(80,20,1)) c3<-cbind(rn

原创 招聘數據分析

描述性分析部分: rm(list = ls()) ## 清空工作目錄 ############# 設置工作路徑**** ## 使用setwd函數,設置自己的工作路徑*** ## setwd(.....) ## package

原创 隨機森林(R)

#### random forest ############ install.packages('randomForest') library(randomForest) data(iris) attach(iris)

原创 決策樹實現(R)

###### decision tree ########## install.packages('rpart.plot') install.packages('rattle') install.packages('RColorB

原创 KNN算法demo(R)

KNN算法 ###### knn 算法 ########## ######## KNN 在R中使用到的包有“class包”,“gmodels包”“FNN”“rKnn”##### ##### 以iris爲例 ############

原创 Hbase安裝及參數說明

1.啓動hadoop start-all.sh 2.獲取並解壓HBase安裝包 tar -zxvf hbase-0.98.9-hadoop2-bin.tar.gz cd hbase-0.98.9-hadoop2 3.配置co

原创 sqoop配置與簡單應用

Sqoop = SQL- to-Hadoop,是易用、並行的導入導出工具。 一. 安裝 1.1 安裝並設置環境變量 解壓縮,重命名爲sqoop sudo gedit /etc/profile 文末添加安裝路徑,別忘了source

原创 R筆記(簡單數據處理)

R語言筆記 #設定R軟件當前工作目錄 setwd("E:/R work") #顯示R軟件當前工作目錄 getwd() #R語言數據預處理常用包安裝 #plyr,reshape2,lubridate, stringr install

原创 Hive安裝

#close firewall #mysql開啓遠程登錄權限#bind-address= 127.0.0.1 #解壓hive-0.13.1-bin.tar.gz tar -zxvf hive-0.13.1-bin.tar.gz

原创 Python爬蟲實戰(動態網頁)

上一篇介紹了靜態網頁的爬蟲,這次我們試試動態網頁怎麼爬取。 #指定瀏覽器位置 chrm = R"F:\Python\chromedriver_win32\chromedriver.exe" #爬取摘要、url等信息寫入數據庫

原创 Python爬蟲入門案例

免責聲明:此案例爲Python入門靜態網頁新聞爬取,未對目標網站進行大批量訪問,不承擔任何責任。 寫入數據庫版本: import requests from bs4 import BeautifulSoup import nump

原创 關聯規則demo

library(arules) # association rules library(arulesViz) # data visualization of association rules library(RColorBr