定序迴歸
什麼是定序迴歸?
定序迴歸的因變量是定序變量,數據類型是順序數據。比如不滿意,一般,滿意;不合格,合格,優秀等。
假設因變量是評分,先由單變量回歸說起,則普通的線性迴歸模型爲
由於方程右邊的普通線性迴歸,是連續性變量,方程左邊是因變量分數,取值爲1,2,3,4,5。左右兩邊數據類型不同,不能進行迴歸。我們考慮引入連續變量Z。先讓Z進行普通線性迴歸。
則Z和評分之間的關係如下:
綜上可得:
所以得到:
對於不同的k有不同的截距
Probit模型和Logit模型
用極大似然法進行參數估計
蘋果實體店客戶滿意度案例分析
描述分析
先瀏覽下數據第一條數據爲因變量滿意度,因變量包含產品等產品的一些數據。
再看一下數據描述:
可視化
先看一下滿意度和產品product的關係
可以看出,分數爲10分的佔比最多,其中Accessary和ipod佔比最多。其餘看不出明顯的差別。各產品類別的評分還是有較大差別。
下面看一下Knowledgeable與滿意度之間的關係
模型建立
用plor函數建模
還可以將Hess設置爲T
直接附上R語言代碼啦~需要數據可以找我私聊。
library(pROC)
library(MASS)
data = read.csv("F:\\learning_kecheng\\huigui\\10廣義線性迴歸\\Apple.csv",header = TRUE)
head(data)
summary(data)
attach(data)
countproduct<- table(滿意度,product)
spineplot(countproduct, main="product滿意度")
plot(c(0,10),c(0,10),type="n",xlab="score",ylab="Percentage",main="Digital Camera")
points(c(0:10),tapply(Knowledgeable ,滿意度,mean),type="b")
pos=polr(factor(滿意度)~product+Timely.Assistance+Personal.Attention+Knowledgeable+Clear.Purchase.Process
+Efficient.Checkout+Friendly...Welcoming,method="probit")
summary(pos)
pos=polr(as.factor(滿意度)~product+Timely.Assistance+Personal.Attention+Knowledgeable+Clear.Purchase.Process
+Efficient.Checkout+Friendly...Welcoming,method="probit",Hess = T)
summary(pos)
POS1 = step(pos,trace = F)
Summary(POS1)