hive 常用數據分析指標 - 網頁訪問數據指標 - 用戶活躍度指標 - 付費行爲指標


      在這裏記錄幾個常用的數據分析的指標,並且慢慢會增加自己工作中用到乃至創造的指標。至於sql,慢慢添加吧。

一、網頁訪問數據指標

1. UV (UniqueVisitor)獨立訪客

      uv - 獨立訪客數 - 一天之內所有的訪客的數量。也就是一天之內,uid去重後的數量。
      訪問的獨立客戶終端(電腦、手機、pad等)爲一個獨立訪客, 技術上已MAC地址作爲唯一身份識別ID。理論上(僅限於理論)24小時重複訪問終端只計算一次。(PS:UV也不同於Visits訪問行爲,Visits通常以半小時爲去重統計週期。)

2. PV(Page View)網頁瀏覽量

      pv - 一天之內的總訪問次數。網頁被訪問瀏覽的次數,也可簡稱爲訪問量或瀏覽量。有些統計工具把用戶每次刷新都計算一次個PV(這也是很多網站PV虛高的原因之一),由於PV數據通常是相對(UV/IP/RU/WAU)最高的數據指標之一,所以網站訪問量是目前互聯網公司對外公佈的統計數據中,幾乎是最常用的口徑。

3.(Internet Protocol)獨立IP

      4. 新增IP。即以前從未出現過的ID,也就是:一天之內所有ip去重且在歷史數據中從未出現的數量。

select count(distinct dataclear.cip) 
from dataclear 
where dataclear.reportTime = '2020-02-17'
and cip not in
(
	select dc2.cip 
	from dataclear as dc2 
	where dc2.reportTime < '2020-02-17'
);

4. BR(Bounce Rate)跳失率

      指訪問陸頁(Landing Page)後,未點擊進入任何其他頁面或發生其他交互行爲,即直接離開的訪客佔訪問該着陸頁所有訪客的比率。該指標可以衡量一個網頁或者一個網站的質量度高低。

/* 等幾天再寫字段和表啥意思   */
select 
	round(br_taba.a/br_tabb.b,4)as br 
from (
	select 
	count(*) as a 
	from (
		select ssid from dataclear
		where reportTime='2020-02-17' 
		group by ssid 
		having count(ssid) = 1) as br_tab
	) as br_taba,
	(select
		count(distinct ssid) as b 
	from dataclear 
	where reportTime='2020-02-17'
) as br_tabb;

二、用戶活躍類數據統計指標

1.RU(registered users)註冊用戶

      已完成註冊的用戶數,嚴格數據應是經過有效驗證激活的註冊用戶數,而放大數據則可以填寫提交註冊信息提交完成即可。

2.AU(Active users)活躍用戶

      某一個時間段內登錄或使用了某個產品的用戶。

3.DAU(Daily Active User)日活躍用戶

      單日登錄或使用了某個產品的用戶數(去除重複登錄的用戶)。通常遊戲類付費網站會採用DAU的概念。

4.MAU(monthly activeusers)月活躍用戶

      把DAU的統計週期拉長到一個月,即是MAU的數據。

5.DNU(Daily New Users) 每日新增用戶

      即當日新註冊並登錄的用戶數。

6.ACU (Averageconcurrent users)平均同時在線用戶數

      平均同時在線用戶數,通常採用 24小時內每小時同時在線的用戶數總和除以 24小時。

7.PCU(Peakconcurrent users )最高同時在線用戶

      24小時內同時在線的最高用戶數。如果希望數據表現較高,通常可採用一個小時內同時在線用戶數最大的值;如果更嚴格,也可以統計某一秒鐘同時在線用戶數的瞬間峯值。

8.TS(Time Spending)用戶平均在線時長

      所有在線用戶總時長,除以該時段內的在線用戶數。

9.URR(Users RetentionRate)用戶留存率

      新增用戶中,在某一週期之後仍然活躍的用戶佔總新增用戶的比例。按不同間隔日爲統計週期單位來計算的,是比較嚴格的;根據不同的產品使用頻次特性,按以周間隔爲統計單位來計算相對更合理,因爲很少的產品是需要用戶每日都登錄使用的。
      次日留存:2020年1月1日的次日留存=2020年1月1日訪問過且2020年1月2日依然訪問的訪客數 / 2020年1月1日訪問的用戶數。
      次7日留存:2020年1月1日的次日留存=2020年1月1日訪問過且2020年1月8日依然訪問的訪客數 / 2020年1月1日訪問的用戶數。
      注意:次7日留存指的是 - - 今天訪問,7天后再次訪問;而不是今天訪問,從今天往後7天內任意一天訪問。

/* 
	cuid是訪客的id。
	這裏使用了笛卡爾積,其實使用left join也可以。
*/ 
select
	count(cuid) ci,
	count(cuid)/t11.uv  ciL 
from 
(
	select
		cuid	
	from tb_cuid_1d 
	where event_day = "20190101"
	group by cuid
) t1 
join 
(
	select
		cuid	
	from tb_cuid_1d 
	where event_day = "20190102"
	group by cuid
) t2 on t1.cuid = t2.cuid
,(
	select 
		count(cuid) uv
	from 
	(select 
		cuid
	from tb_cuid_1d 
	where event_day = "20190101"
	group by cuid
) t11
;

10.UCR(Users Churn Rate)用戶流失率

      與“用戶留存率”相對的一組概念,指新增用戶中,在某一週期之後無登錄使用等活躍行爲的用戶。
      用戶流失率=(1-用戶留存率)*100%計算

三、用戶付費行爲數據統計指標

1.PU(Paying User)付費用戶

      有付費行爲的用戶。該指標弱化了統計週期的背景,所以在數據統計中不常採用。

2.CR(ConversionRate)付費轉化率

      新增用戶中,有付費行爲的新用戶除以總新增用戶數。此公式與電商網購中的支付轉化率指標類似。

3.ARPU(Average Revenue Per User)平均每用戶收入

      衡量一個時間段內某個付費產品或業務收入水平的指標,通常電信運營商或網絡遊戲公司等採用較多,而零售電商則較少採用。

4.ARPPU(Average Revenue Per Paying User)平均每付費用戶收入

      ARPPU=某一時段的總收入/該時段的總PU數。

5.APA(Active PaymentAccount)活躍付費用戶

      指統計週期內仍保持活躍的付費用戶(活躍PU)數,此處的用戶通常以用戶註冊ID爲準。需要排除曾經有付費行爲但在統計週期內無任何活躍行爲的靜默付費用戶(靜默PU)。

6.PUR(Paying User Rate)用戶付費率

      計算公式爲:APA/AU,通常以特定統計週期內的活躍用戶爲統計前提。指統計週期內的活躍付費用戶(APA)數除以該週期內的總活躍用戶(AU)數。

7.LTV(Life Time Value)生命週期價值

      從用戶從最第一次登錄到最後一次登錄的整個生命週期過程中,所貢獻的全部經濟收益價值總和。而由於用戶的生命週期通常難以統計,所以在實踐中,更多采用“LTV_N”來統計新用戶在首次登錄後的N天內,所貢獻的價值總和。此指標更爲靈活實用。

三、 總結

      上面這些,只是一些比較常用的運營數據統計術語而已,還不能說是大全,在遊戲和APP運營中,還有很多更爲細緻的數據指標。
      隨着產品形態及生命週期階段的不同,偏重的數據分析指標都會有些差異,數據統計分析指標也會源源不斷的創新湧現。只要是對所運營的產品業務數據分析有實效,你也可以自己創設新的數據統計分析指標,這並非是某些權威人士纔有的特權。

四、 不知道是啥的

      本人年少無知,有幾個指標不知道是怎麼分類。。。

1. vv(不是W,是兩個V)

      vv(不是W,是兩個V) - 獨立會話數,一天之內會話的數量,也就是一天之內ssid(標識會話的字段)去重後的數量。

2. 新增客戶數。

      新增客戶數。即以前從未出現過的客戶(可用某個字段作爲客戶的唯一標識,用此字段進行篩選),類似於新增IP。也就是:一天之內的user_id(假設用該字段作爲客戶的唯一標識)去重且在歷史數據中從未出現的數量。

3. 平均訪問時長。

      平均訪問時長:一天內所有會話的訪問時長的平均值(表中有一個字段記錄了訪問的時間,假設爲stime)。一個會話時長=會話中所有訪問的時間的最大值 - 會話中所有訪問時間的最小值。(這個有點沒太弄懂,後面再研究研究)

select avg(atTab.usetime) as avgtime 
from
(	select max(stime) - min(stime) as usetime 
	from dataclear 
	/*  reportTime 是訪問時間*/
	where reportTime='2020-02-17' 
	group by ssid
) as atTab;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章