R語言筆記:用R語言繪製箱線圖

        箱形圖,主要用於反映原始數據分佈的特徵,還可以進行多組數據分佈特徵的比較。箱線圖的繪製方法是:先找出一組數據的上邊緣、下邊緣、中位數和兩個四分位數;然後, 連接兩個四分位數畫出箱體;再將上邊緣和下邊緣與箱體相連接,中位數在箱體中間。其實,我們有專門的工具用來繪製箱線圖,比如R語言。代碼如下:

> # 傳入數據
> x <- c(0, 71.5, 169.5, 392.4975, 498000, 0.01, 9.91, 29.9, 89.4, 123000, 0, 19.9, 39.9, 69.9, 888888)
> # 自定義分組因子
> y <- factor(rep(c("淘寶", "抖音", "快手"), each = 5))
> # 生成數據框
> data <- data.frame(x,y)
> # 繪製箱線圖
> boxplot(x~y,data)
> boxplot(x~y,data, main = "三大平臺價格帶對比分析(修剪前)")

運行結果:

        因爲存在極差特大的離羣點(最大值)影響,干擾了我們的視覺,不利於我們做數據分析,所以通過觀察,我們統一取略大於淘寶第三分位數392.4975的值400作爲修剪後的最大值。更新數據後的代碼如下:

> # 傳入數據
> x <- c(0, 71.5, 169.5, 392.4975, 400, 0.01, 9.91, 29.9, 89.4, 400, 0, 19.9, 39.9, 69.9, 400)
> # 自定義分組因子
> y <- factor(rep(c("淘寶", "抖音", "快手"), each = 5))
> # 生成數據框
> data <- data.frame(x,y)
> data <- data.frame(x,y)
> boxplot(x~y,data)
> # 添加標題
> boxplot(x~y , data, main = "三大平臺價格帶對比分析(修剪後)")
> # 給X軸和Y軸重命名
> boxplot(x~y, data, main = "三大平臺價格帶對比分析(修剪後)",xlab = "平臺",ylab = "價格")
> # width參數定義箱體的相對寬度,col參數定義箱體的填充色,border參數定義箱線圖的邊框顏色
> boxplot(x~y, data, main = "三大平臺價格帶對比分析(修剪後)",xlab = "平臺",ylab = "價格",col = c("yellow"))

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章