1.常見聚合函數
Tabluea中常見的聚合函數有以下幾種。
函數名 | 含義 |
---|---|
ATTR | 如果所有行都有一個值,就返回該表達式的值,否則會返回*。該函數忽略NULL |
AVG | 返回表達式中所有值的平均值。 |
COUNT | 返回組中的項目數 |
COUNTD | 返回組中不同項目的數量 |
MAX | 返回表達式在所有記錄中的最大值 |
MEDIAN | 返回表達式在所有記錄中的中位數 |
MIN | 返回表達式在所有記錄中的最小值 |
PERCENTILE | 從給定表達式返回與指定數字對應的百分位的值。percentile(expression,num) |
STDEV | 基於羣體樣本返回給定表達式中所有值的統計標準差 |
STDEVP | 基於有偏差羣體返回給定表達式中所有值的統計標準差 |
SUM | 返回表達式中所有值的總計 |
VAR | 基於羣體樣本返回給定表達式中所有值的統計方差 |
VARP | 對整個羣體返回給定表達式中所有值的統計方差 |
2.計算依據
SQL中也有聚合函數。在SQL中,如果語句中沒有Group By子句的話,那麼Select中的聚合函數會對錶中的所有記錄進行聚合操作;如果有Group By子句,則按照該子句中的字段對數據進行分組後,然後對每一個組中的數據進行聚合操作。以Tableau中的【超市】中的【銷售額】數據爲例,來看看Tableau中聚合函數的分組依據。首先,來看看銷售額總和(可以分析->查看數據 看到具體的數據):
(1)將【維度】框中的字段拖到 【列】或【行】中,這個時候實際上是對相應字段中的不同值進行聚合彙總。
(2)將【維度】框中字段拖到【標記】中的【顏色】、【大小】中,也可以對響應字段中的不通知進行聚合彙總。
簡單判斷以下即可知道,在畫圖的過程中,拖拽離散變量到畫圖區即可以按照該字段進行聚合彙總。
3.計算字段的寫法
使用聚合函數可以創造計算字段。計算字段中要注意聚合函數的使用,否則彙總出來的結果可能不是我們想要的。仍然以【超市】數據爲例,該數據中【利潤率】字段的寫法如下:
下面我們再新建一個利潤率的計算字段【利潤率1】。對兩個計算字段得到的結果進行對比。
將【維度】中的“地區”字段拖拽到【列】中,然後將【利潤率1】和【利潤率】兩個計算字段拖拽到【行】中,然後點擊查看數據結果如下:
從上述結果中可以發現,計算字段【利潤率1】得到的結果並不是我們想要的結果。 從圖上我們可以看到,將【地區】拖拽到【列】中之後,其計算公式爲sum(【利潤率1】),是將每個地區中的所有訂單的利潤率進行加總求和。