R語言與Tableau集成之可視化應用

Tableau是一款非常棒的數據可視化商業軟件,通過拖拉拽的方式迅速的實現數據可視化。而且該軟件可以連接任何一種數據庫,在處理大型數據時一點都不遜色。
缺點是其無法從事數據分析和挖掘工作,幸運的是,從Tableau的8.0開始,Tableau與R語言打通,可以在Tableau中運行R腳本,從而將R語言的分析或挖掘結果在Tableau中展示。
如何實現Tableau和R語言的聯手繪製可視化圖表呢?
首先需要在R中下載Rserve包

install.packages(‘Rserve’)

library(Rserve)

啓動R服務器

Rserve()

其次,通過Tableau連接R語言。
在Tableau界面下連接R語言:“幫助”——“設置和性能”——“管理R連接”,輸入服務器及端口號即可成功連接(這裏的服務器是本地機算計,故服務器填’localhost’)。
在這裏插入圖片描述
一、如何將統計學意義的異常值尋找出來?
通過R創建異常值字段:
在這裏插入圖片描述
在這裏插入圖片描述
上圖的異常值判斷標準是:超過上四分位數的1.5倍四分位距或低於下四分位數的1.5倍四分位距。
二、連續變量的預測
雖然Tableau可以直接繪製趨勢線,並根據趨勢線做預測,但是這僅僅是一個因變量與一個自變量之間的趨勢關係,如下圖繪製的利潤趨勢僅僅與時間維度相關:
在這裏插入圖片描述
如果影響利潤的因素由銷售數量、銷售額和折扣率三個變量組成,該如何將回歸後的預測體現在圖中呢?
通過R擬合預測值:
在這裏插入圖片描述
在這裏插入圖片描述
從圖中的結果顯示,預測與實際的趨勢一致,是一個比較理想的預測模型。
三、聚類分析
聚類分析是數據挖掘中無監督的算法之一,R語言可以非常便捷的實現各種聚類算法,如K-Means、K中心、EM期望最大法、層次分析等,下面就是要K均值算法的距離結果在Tableau中展示:
在這裏插入圖片描述
在這裏插入圖片描述
強大的可視化工具與強大的統計分析工具讓你的工作變得更加高效和方便

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章