數據百問系列:如何衡量一張或者多張數據表的價值?

0x00 前言

本期話題討論:如何衡量一張或者多張數據表的價值?

如上,是居士最近看到小夥伴們討論的一個問題,一些朋友也問過類似問題,因此發出來給大家來討論,本文是將大家的討論彙總成文,同時在末尾加上居士自己的理解。

0x01 討論觀點分享

討論1

數據表的價值,要看是給誰看的。如果只是小白爲了出報表湊數據,那價值就是幫助別人添花,如果是給懂數據和邏輯的同事看,而且能夠層層遞進直到觸及問題根源,那價值就很大。同樣是轉化率,一個頁面的轉化率和一個登陸模塊的轉化率,就有很大的價值區別。總結一下,價值要看人看事兒。

討論2

先定義低價值的特徵可能會更簡單一點,至少長期不被使用的表或字段,可以認爲是低價值的,這應該是毫無疑問的。

討論3

  1. 接入層和中間層,一般看這個表對應節點的下游節點的節點的多寡,如果是被引用或者依賴的次數比較多,會被列入重點監控的對象,自然其簡直就會高

  2. 應用層,一般會同步外部存儲進行報表展示,或者提供接口供外部訪問,這種情況下,沒有直接的下游節點,可以根據報表查看的次數或者接口調用次數來評價

  3. 部分面向特定場景的數據(高層或者財務結算等),其下游依賴節點少,訪問頻次也不高,但是因爲彙報對象很重要,其數據的價值也比一般的表要重要

討論4

最簡單的指標就是字段在單位時間內被查詢的次數

討論5

需要結合他的使用對象,在整個數據鏈條中的位置來看,不同的角度對於價值的定義及看重程度都是不同的。對於業務人員來說就是它對於需求滿足的程度,對於技術方來說則關注他的引用次數和複用度。最好的當然是不同的思維相結合,一步一步一點點的把複雜的業務場景問題拆解反映到數據上

討論6

經營分析類報表還是以業務使用情況來評判,比如單位時間內的查看次數;非經營分析類(比如我們保險行業合規類)我們一般會推送到各系統中,這種需要看從各業務系統調用情況看

討論7

  1. 分不同崗位職級,比如高層更多看的是彙總指標,單個客戶明細表反而對一線員工更有價值,畢竟每個崗位層級能夠操作乾的範圍不同

  2. 分業務階段性戰略目標,比如一張表是用來出數量的,後期業務調整,開始着重看客戶質量等,那前期的數量相關表就基本沒太多作用

  3. 看使用者用途,比如決定性方向的會議or用來甩鍋的會議or只是用來看看,對方對於數據表的需求(準確性一致性等等)都不同,本身的價值也不同

0xFF 總結

整體來講,居士的意見和討論3比較接近:

  1. 接入層和中間層,一般看被引用或者依賴的次數

  2. 應用層,一般看報表查看的次數或者接口調用次數來評價

  3. 部分面向特定場景的數據(高層或者財務結算等),不太容易量化價值,但是很重要!

然後,從另一個角度來看,單純看錶的價值,其實已經會比較被動了,這也是數據倉庫同學經常會面臨的問題,因爲不管再怎麼考覈,這些表離業務價值還是太遠了。

所以脫離表的角度來講,可以多從其它角度思考,比如:

  1. 這些表提升了所支撐業務多少的運營效率?

  2. 比如廣告、推薦等模塊的提升效果裏面,多少是你的表或者特徵帶來的提升

  3. 多做一些和業務提升貼近的數據,比如用戶畫像數據,可以用作提升DAU或者收入的用戶圈定表等等

離業務越近,越容易體現價值。

熱門文章

直戳淚點!數據從業者權威嘲諷指南!

數據分析師做成了提數工程師,該如何破局?

全棧型VS專精型,團隊到底需要什麼樣的人?

數據驅動業務,比技術更重要的是思維的轉變

最近面了十多個數據分析師,聊一聊我發現的一些問題

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章