原创 R做購物籃關聯分析

運用apriori算法 #安裝arules包並加載 #內置Groceries數據集 install.packages(“arules”) #下載軟

原创 主成分和因子分析的區別

1. 原理不同: 主成分分析(Principal components analysis,PCA)基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化爲幾個不相關的綜合指標(主成分),即每個主成分都是原始變量的線性

原创 AR模型和線性預測的關係

設x(n)在n時刻之前的p個數據已知,我們希望利用這p個數據來預測n時刻的值x(n),預測的方法很多,我們用線性預測來實現,是真實值x(n)的預測,那麼有: 令真實值和預測值之間的誤差是e(n),則有: 因此,總的預測誤差功率爲:

原创 R交互化展示-shiny包

install.packages(“shiny”) library(shiny) #查看實例 runExample() runExample(“01_hello”) #定義web應用的用戶界面 shinyUI(pageWithSi

原创 R進行相關性分析

一、相關性矩陣計算: [1] 加載數據:   data = read.csv(“231-6057_2016-04-05-ZX_WD_2.csv”,header=FALSE) 說明:csv格式的數據,header=FALSE 表示沒

原创 R構建RFM模型

RFM模型僅僅是一個前期的探索性分析,可以利用RFM模型輸出的指標結果還可以進行其他分類以及降維模型的構建,深入探索客戶數據價值,挖掘潛在營銷點。 RFM模型是市場營銷和CRM客戶管理中經常用到的探索性分析方法,透過模型深入挖掘客

原创 R實現數據抽樣

訓練集與測試集 x爲輸入變量,y爲輸出變量。利用訓練集中的x,y建立模型。 將測試集中的x帶入模型,來預測測試集目標輸出變量y的值,設爲y’,將訓練集的x帶入模型,來預測訓練集目標輸出變量y的值,設爲y’’。那麼y’’

原创 R數據可視化-ggplot2包

ggplot2作圖 qplot函數: install.packages(“ggplot2”) library(ggplot2) #ggplot2自帶的數據集diamonds diamonds getOption(“max.prin

原创 較常使用的分析方式

1.主成分分析 主成分分析主要是一種探索性的技術,在分析者進行多元數據分析之前,用他來分析數據,讓自己對數據有一個大致的瞭解,這是非常有必要的。 主成分分析一般很少單獨使用:a、瞭解數據。(screening the data),b、和c

原创 R做數據處理

1、數據獲取的SQL語句 #查看創建的表 SHOW CREATE TABLE dmk.dmk_sal_actual_sales_dtl; #用原有的表創建一張新表 CREATE TABLE temp.dmk_sal_actu

原创 時間序列分解法

目錄 時間序列的模式 時間序列分解法各因素的確定 1.移動平均數 2.季節性

原创 R做判別分析

線性判別法: library(MASS) ld=lda(G~x1+x2) z=predict(ld) newG=zclasscbind=(G,zclass cbind=(G,zclasscbin

原创 相關和迴歸分析

標準化 正態分佈(Normal distribution),也稱“常態分佈”,又名高斯分佈(Gaussian distribution),最早由A.棣莫弗在求二項分佈的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了

原创 FRM模型

根據美國數據庫營銷研究所Arthur Hughes的研究,客戶數據庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標: 最近一次消費(Recency) 消費頻率(Frequency) 消費金額(Monetary) 最近一次消費   

原创 平穩性、正態分佈、白噪聲和方差齊性

平穩性 時間序列平穩性的定義   現象:始終在一常值附近隨機波動,波動範圍有限,且無明顯趨勢及週期特徵。          假定某個時間序列由某一隨機過程(stochastic process)生成,即假定時間序列{Xt}(t=1, 2,