數據分析面試集錦

面試題目

Catalog:Click to jump to the corresponding position

一、提升活躍率問題

二、總裁PPT問題

三、地產中介培訓問題

四、客戶價值指標定義問題

五、銷量下降問題

六、流失原因問題

七、物流費用問題

八、數據盈利問題

九、新房銷售問題

十、網紅模式問題

十一、網站銷售數據

十二、公衆號活躍數據問題

十三、APP活躍數據問題

十四、網遊用戶流失問題

十五、電商市場拓展問題

十六、報表意見收集問題

十七、戰敗用戶的問題

十八、渠道商提貨問題

=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=

一、提升活躍率問題

“我去面試一個企業,人家說,我有1億註冊用戶,月活躍2500萬,他們想把剩下7500萬非活躍的變成活躍的,問我有什麼辦法,我怎麼說???關鍵是我不瞭解他們的業務啊!”

錯誤答法:

還有一個錯誤答法:2500萬的活躍用戶算低嗎?

有這種思維是好的,但是在面試的時候不能直接懟回去,數據分析師永遠不要做判官,我們只提供分析方法,老闆纔是判官

示例答法:

①拿出一張紙畫出結構

問面試官:

您好,確認一下您的問題啊,看看我理解的對不對,就是咱們現在有一億的註冊用戶,活躍的用戶是2500萬,在活躍用戶以外還有很大的空間,我們想擴大活躍空間,對不對?

目的:

我們不瞭解公司情況,對方又必須我們回答,我們要把節奏託下來,爲我們自己爭取更多的說話機會,而且重複問題是一種很專業的表現(尊重對方、專業性高)

②統一口徑

問面試官:

您說有2500萬的活躍用戶,那怎麼樣算是活躍?是打開一次app,還是使用一次產品?或者是消費一次呢?

有一億的註冊用戶,是有一億個客戶表格信息?還是有一億個系統記錄ID,再或者是開通了你們某項功能呢?

目的:

統一口徑、寫下來顯得你尊重對方、箭頭暗示後面還有下文,讓其不會覺得我們是在拖延時間

③詢問業務

畫出結構圖

問面試官:

那麼我們是隻考慮用戶的活躍率問題,考不考慮用戶的付費問題呢?

目的:讓面試官多和你聊公司業務相關問題

④給出結論

1.既然有2500活躍的活躍用戶,那麼我們可以根據這個活躍用戶構建出用戶結構,梳理出活躍用戶畫像,可以對比我們活躍用戶的來源渠道,付費習慣等。

2.構建了用戶結構之後,我們可以將不同類用戶的生命週期刻畫出來,然後發現各類用戶是在什麼節點增長、流失的,可以在相應的節點作出一些動作。

技巧介紹:

這一招叫反客爲主,是應付不太清楚背景,又必須回答問題的情況下祕籍,關鍵在於降低對方速度,給自己緩衝,留下思考時間,拖進我們的節奏

同時,可視化可以展示我們的能力與信心

並且,即使這個問題我們不太清楚答案,一個流程走下來,也顯得80%環節是清晰的!這能大大緩解提問者的焦慮,爲我們掙得主動

二、總裁PPT問題

問:你是一個大型多元集團

下邊互聯網金融公司的數據分析師,今天是9月1日,9月30日你的集團總裁要在一個行業會議上發表《新零售下互聯網金融的人工智能發展》

一篇演講,請你做相關的ppt,你會怎麼做?

錯誤答法:三天以後把PPT拿來了!!!

示例答法:只是問你會怎麼做?

①搞清楚各個部門誰是牽頭人,誰負責這個事情?出鍋了誰背?誰牽頭意味着找誰推動這個事情

②搞清楚誰審批,是我一層一層向上彙報,還是大家一起開個會現場決定?

③搞清楚都有哪些部門參與

④確認項目各個部門的負責人,找誰推動,審批等

⑤確認時間表,根據總裁需要的時間往下逐級安排時間流程,什麼時間完成什麼事

⑥確認分工,專業的人幹專業的事情

背後含義:

這就是一個企業裏項目立項到落地的全過程

所以說到底主要的考點就是項目意識

啓示錄:

1.數據分析工作 =/= 寫代碼 =/= 自己寫代碼

2.在企業內工作,就有領導,有領導的領導,有領導的領導的領導,主動向領導請示項目質量,有問題及時向領導多溝通

3.在企業內工作,就有目標,時間,工作計劃,分工

4.切記,向領導請示目標,向項目組確認進度,向同事尋求幫助,向下屬分配任務,自己圍繞目標輸出成果。

5.爲什麼你覺得自己缺乏經驗,因爲你做的只是其中一環!如果你覺得自己缺乏經驗,動向上下平級溝通,補全項目鏈條!

三、地產中介培訓問題

 一地產中介,準備培訓新進的二手房中介,以提升中介能力,最終目標是想讓每個中介每月能促成3筆交易。

問:用哪些指標可以衡量培訓效果?

 一般回答:

可以統計3單完成率的增幅、每個人培訓前後的單數對比、培訓完成後平均單數的增加絕對量對比等

深入回答:

①先思考人均3單的目標是怎麼來的?爲什麼不是4單,5單,或者8單,就偏偏是3單?

②查看成交比例結構,看看有多少人是有成交的,沒有成交的人佔多少比重

③細分成交數據結構,觀察在已經成交的人裏,成交1單、2單的人數……,已經每個成交單數層級貢獻的總單數

可能業務部門只是算了個平均成交單數發現是2.1單,於是就設定了3單的目標

我們細分結構以後發現其實無成交的人佔絕大部分,總單數裏也是少有的銷售王牌貢獻的單數

所以,目標的完成難度就顯而易見,當我們發現這種問題的時候就可以對症下藥,針對無成交的人設定目標,針對成交1單的人設定完成目標,而不是籠統的對比總指標。

一個非常深層次的問題:

領導期望 VS 時間+能力

控制領導期望很重要:

1. 量化考覈指標

2. 從簡單的做起

3. 逐步輸出成果

4. 不斷進步迭代

5. 弱化複雜問題的權重

四、客戶價值指標定義問題

數據分析三大要素是我們的命根子:1.數據來源、2.指標口徑、3.統計方式,不然給的數都是錯的,分析有啥用?

問題:

解答思路:

先將字段分解,然後給出選項,並且從易到難排序,先推簡單的,載推難的

主要考點:

啓示錄:(解題思路)

養成下面這個好習慣,不止面試,日常工作都很受益

1. 審題

先審題,不要一看到問題就想着上模型

2. 確認口徑

如何計算這個問題,確保口徑正確

3. 分解問題

如果問題包含好幾個名詞或者指標,需要做分解

4. 給選項

在面試特別重要,多給幾個選項,優先推薦其中一個,給自己留下後路

越是主動給選項,越容易控制領導期望

5. 找領導確認

不要自己埋頭幹,多和領導確認溝通

6. 分步驟完成

落地逐步做,簡單的先做,逐步給領導展現成果

五、銷量下降問題

面試某外賣平臺,HR問:“我們在上海地區的交易額比較差,分析下原因”怎麼答?

這是一個典型的 爲什麼 的問題,在回答此類問題時,答案一定是原因1可能是、原因2可能是、原因3可能是……

不是這個答案的就答跑題了,HR和領導都喜歡直面回答問題

 

審題:

比較差--是一個形容詞,那麼就要問比較差的標杆是誰?多差算差?好的標準是什麼?

是什麼:

在什麼時間比的,是這一天差了,還是一週差了,還是一直以來都很差?(一次性/還是連續性?,持續性/間歇性?)

一次性可能是事件導致的,間歇週期性要考慮週期問題,最好具體到什麼時間什麼情況什麼地方發生了什麼事情?

問題是越來越嚴重還是有向好的趨勢?

爲什麼:

給的原因最好是可以對應到部門,比如用戶、產品、競品等,不要給什麼用戶活躍低了,因爲用戶活躍低了好像和每個部門有關

分析問題三大問:

1. 是什麼?(確認數據)

2. 爲什麼?(尋找原因)

3. 做什麼?(給出建議)

這是個典型的“是什麼+爲什麼”問題,是什麼被隱藏掉了,很多人容易掉坑!

參考答案:

1. 明確數據的來源和準確性:是哪個部門說業績變差的?他們的數據來源是什麼?是否覈對的數據確保數據沒有問題?

2. 明確數據口徑和時間段,哪個時間段內的業績,對標是什麼,評價標準是什麼,爲什麼說變差了?

3. 明確這是不是個問題,業績下降是季節性波動,還是內部調整所致

4. 從商戶視角和用戶視角分析,是商戶問題還是用戶問題,

① 如果是商戶問題是哪個區域的商戶問題,是不是集中在某個區域,因爲競爭對手產生的影響或是天氣等客觀因素,還是內部運營問題。

② 或者是否集中在某羣用戶,比如老客流失的很多,或者這是個處於成長期的平臺,新客很重要但新客增長開始放緩了。針對不同的客羣,找不同的部門,是推廣沒做好,還是會員部沒做好。

六、流失原因問題

某旅遊電商平臺,領導面試,問:“不用調研的方式,從數據上如何看出用戶爲什麼流失?”

解題思路:

但是上面這個思路不能解決上面的問題,因爲這個問題的背景是旅遊電商,不是電商零售的背景,所以需要補充背景知識,但是上面的框架是可以用的

這是個典型的“爲什麼”問題、爲什麼=/=做什麼!腦子一定要清醒

解題要點:

爲什麼的關鍵是找到問題來源,因此分解原因最重要

分解原因最理想的是MECE,但是很難做到

分解原因最好按部門KPI進行分解,方便跟進解決問題

這個答案是個萬能解,因爲它是符合MECE原則的

實際上,知道原因後可以對症下藥解決問題,降低流失率,但不代表已經流失的會滾回來,這是兩個問題!

如果有做什麼,那麼就會複雜的多

以流失挽留爲例,知道了爲什麼流失,不代表就可以因爲所以給答案

因爲有可能流失原因我們是無能爲力的,有可能是難以改進的

做流失挽留,要一看是否有價值挽留二看是否有手段挽留三看是否ROI好看,最後只能在有限範圍內做挽留。

七、物流費用問題

你在一個電商公司,主營海淘母嬰,家居,美容,保健品,數碼家電,副食品。公司在華東,華中,西南有三個貨倉。

目前門檻是滿88元包郵,但總有身邊朋友及用戶抱怨門檻高。

問:滿88包郵是否太高?是否需要調整?建議怎麼調?

題後思考:

見到“有人說”先搞清誰說!

見到“高、低、大、小、多、少”先樹標杆!

見到“怎麼做”先區分基於現狀還是基於預測

要預測,業務部門先給動作,分析部門再給測算!

八、數據盈利問題

面試公司是運營商的乙方,提供企業通信領域服務,也基於運營商數據提供 一些分析服務,面試官是用人部門領導。現問題如下:

有四個字段數據,手機號碼,經緯度,用手機訪問的網址,時間。

問,在如下兩種情況下,如何通過上述數據獲利:1.童裝店怎麼盈利?2.銀行怎麼盈利?

這就是考驗數據分析師的基本功,如何通過字段看出背後的業務含義

這樣衍生劃分以後,我們就可以有許多信息可以解讀了,比如白天的時候是在步行街還是CBD上班,晚上是在那個檔次的住宅區居住等

再比如,節假日是在國內風景區,還是國外旅遊等,相應的都可以進行業務上的操作

隱藏坑點:

解題思路:

考察要點:

加工字段需要一級級向上提煉

不要直接跳到 早中晚步行街的人怎麼怎麼樣,要一級一級提煉,時間分爲早中晚等,經緯度分爲各類位置,再去講字段進行下一級的提煉

不一級一級提煉容易考慮不完善,容易丟失一些想法

即使同一個字段,不同的加工方式也會產生新的含義

比如時間 想到早中晚,到你想到週末工作日沒?想到長假短假區別沒?想到雙11這種特殊日子沒?

與其總想着拿新數據(大部分時候難度很大)不如想着如何利用資源

當你總覺得數據不夠時,你缺的不是數據模型、缺的不是模型,你缺的是思考深度。

九、新房銷售問題 

你的公司主要做新房銷售,現手頭數據有當年的業務員人數,業務員業績數據。領導在糾結是否要停止在某市的業務,因爲感覺該市的新房銷售數量會逐步減少。

問:如何用數據分析支持這個判斷?

問題坑點:

1.如何用數據分析支持這個判斷?

領導要的不是科學結論,而是支持!

2.現手頭數據有當年的業務員人數,業務員業績數據。

認真想想,手頭的數據真的足夠嗎?

例如:當我們解讀單個的業績數據時是解讀不出什麼的

但是如果加上兩把尺子,就可以很好的解讀了

所以這個問題裏面是缺少數據的,缺少了標尺,我們要試着補全數據

3.你的公司主要做 新房 銷售

認真想想,新房和二手房有什麼區別?

其實新房反而使問題變得簡單,新房的週期是非常長的,所以在本年有多少新房開盤我們是可以獲取到的,這是一個存量競爭的問題

如果我們公司的新房量都已經很少了,那自然銷量也會下降,所以需要通過現有數據去推算我們需要的數據

解題思路:

新房少的論據,要給出,可以獲取外部數據,爬蟲,搜索引擎,行業報告等

可以推算出對手的樓盤佔有量,用總量-我們的樓盤量進行推算,還可以給出對手盤的身份,看看我們是否有競爭力

將銷售按照銷售業績進行等級劃分,查看是否存在沒有王牌銷售的情況,適當提升銷售獎勵等

考察要點:

溝通!溝通!還是溝通!

如果領導都不信我們,我們憑什麼升職加薪?

如果領導需求都搞不明白,你憑什麼能理解消費者?理解市場?

題後思考:

爲什麼你做了很多日報月報,但是分析能力沒有提高?

爲什麼你做了很多年分析,卻感覺沒有深入一個行業?

題目裏缺了的兩根線,有試圖補齊過嗎?

十、網紅模式問題

作爲數據分析部門,請給出你的觀點

問題思路:

這是一個正兒八經的討論嗎?

正方的明星是可以帶來粉絲流量,然後呢?這些粉絲就會購買嗎?收穫新用戶之後會不會付費呢?消費者瞭解了商品一定會買嗎?

反方用戶審美疲勞又怎麼樣呢?疲勞的用戶是我們的重要客戶嗎?疲勞的定義是什麼?一個月不購買還是一個月不看直播?某電商平臺虛假宣傳和我們有什麼關係?我做營銷就會忽視供應鏈嗎?

所以可以發現,正反方出了可量化的論點外,其餘的基本都是扯皮

在決定做不做的時候,我們一定要讓業務部門拿方案出來,這樣我們才能用數據去分析問題,我連你請的明星是哪個都不知道,我分析什麼?

考察要點:

字段、字段、還是字段

數據分析師參與討論問題,必須具體到某一個字段

當我們的業務方在討論一個具體問題的時候,如果他不落實到一個數字上,不落實到一個可考覈的指標上的話,這就是一句廢話,有可能反感,反感又怎麼樣了?會不會影響銷售呢?

在沒有收集到數據之前不輕易下結論,可以給假設

題後思考:

到底什麼是一個真正的問題

可以量化,可以記錄,可以對比的纔是真正的問題

很多時候,數據分析師思考問題,可量化,可記錄,可對比意味者我們必須要有一個字段記錄了這個信息,並且這個信息可以和內部其他數據對比

如果發現我們討論的問題還沒有細緻到這個問題的時候,不要輕易下結論。

實際工作中,相當多的問題根本就是扯皮、潑髒水、YY,沒有看到數據前,所有的理由都是扯皮。

十一、網站銷售數據

 

題目坑點:沒有坑點,但是坑倒了無數人

所有人一眼就看到了週末低,平時高,然後同學們就認真作答了因爲週末低,低就是不好,高就是好的,所以就開始研究把低的要搞高。

解答思路:

是不是低了就i是有問題,高了就是沒問題,9月6--9月10這幾天高的值難度就是真正的高嗎?

9月6號意味者什麼,連續5天這個線是平着走的意味着什麼,爲什麼會有一根線平時高,週末低?

①什麼樣的產品工作日高週末低?

產品可以分爲三大類

這纔是正常的產品線,題目告訴我們是電商女性B2C,那麼爲什麼銷售圖長得這麼像商用B2B呢?

辦公室女性需求很多,題目之說有5種,並沒有具體說哪5種......

②周內連續5天平着走正常不正常?

正常消費趨勢:

每年過年前(1月份)比較高,3月份過完年比較高,4、5、6月基本平着走,7、8月稍微有一點起色

9月接近四季度要開始衝量了、衝業績了,10月有一個國慶假期銷量可能低一點,11、12月一定是業績網上很飆的

所以題目給出的數據反映出有問題的,9月6號開始衝量了怎麼可能平着走?

③看產品結構

通過堆積圖觀察問題所在

對比同類產品在周內週末的銷量趨勢,發現問題所在

如果5類產品的趨勢都是在周內高,週末低,那就說明我們的產品品類不夠完善

如果有產品周內高,週末更高,那麼應該引進更多此種類的產品

④觀察其他數據,以觀現狀

往前多看幾週數據,看看周內平着走是否健康,如果發現前幾周也是平着走,那問題大了去了,一個企業該衝量的時候上不去,不就面臨倒閉麼

先判斷是不是運營的問題,看新客戶、老客戶、流失率等

下一步看產品,通過第三步的產品結構發現問題,是否用戶需求沒有挖掘還是用戶推廣的問題等

運營計劃:

 

考察要點:先看大趨勢再看細節

先看羣體,再入細節

解析銷售,人(用戶)、貨(產品)、場(渠道)永遠好用

銷售額=用戶量*轉化率*客單價的公式要經常記得,找原因要對應去找

十二、公衆號活躍數據問題

看波動趨勢小技巧:將每週平均值算出來,用每天的數除以平均值,這樣把大家拉到一根線上,可以看他的波動幅度和波動趨勢

 

解題思路:

①我們發現整體趨勢是往上的,但是這種增長合理嗎?推廣渠道新進了多少用戶呢?

②週一週五是明顯的谷底,這種波動性是合理的嗎?前幾周的數據如何呢?

③只看到了訪問數據,但具體的活躍率是多少呢?一萬粉絲2900活躍 和 10萬粉絲2900活躍是兩個概念哦

綜合考慮:

考察要點:(先看大趨勢再看細節)

繼續先看整體,再入細節

關注整體趨勢,數量&比例同樣要看

不要對日報曲線習以爲常,那樣會錯過很多分析機會

主動收集波動浮動背後的走勢,(圖像應該長什麼樣子?、周與周有沒有異同?月與月、年與年呢?不同的點發生了什麼?背後有什麼業務含義?)對於提升分析能力至關重要

十三、APP活躍數據問題

 

 

 解題思路:

這種情況下是活躍度崩盤的情況,所以需要哪低看哪!

考察要點:先看大問題再看細節

當出現重大問題的時候,第一時間懷疑數據本身

第二時間找那些有能力影響全局,動搖根本的部門(先找客服問是否有顧客投訴、再看產品是否出現BUG等)

不要遇到問題就想着一堆維度,分析速度快慢也是能力的體現

解讀波動是數據分析的基本功,然而解讀波動也是需要經驗積累的,多多努力,比如用戶活躍降低80%在電商行業是個大事,但是在保健品行業就是正常的

十四、網遊用戶流失問題

 

是什麼?

用戶留存率不夠,用戶留存率不夠

爲什麼?

①國產遊戲的留存時間非常短(騙錢、關服重開等原因):所以數據週期爲首日、次日等

 

 所以確認了app類型,對於我們怎麼看他的用戶留存率非常重要

②有流量導入,但DAU很低

求證數據,查看用戶到底漏在了哪一個階段,即用戶流失的具體形式、以及流失用戶是從哪個渠道來的。

例如:如果第二天用戶就流失,那麼需要考慮是不是新手指引沒有做好,渠道投放是不是選擇錯誤,是不是在垃圾渠道投放的等等,具體問題具體分析

 

這個時候可以去上模型,上漏斗模型,看活躍轉化。

 

考察要點:抓住問題本質

是什麼

爲什麼·做什麼

一步步來,缺什麼補什麼

十五、電商市場拓展問題

 

發現問題:

一般問題要不出現在開頭、要不出現在結尾,開頭是(爲了......)的形式,結尾是(以......)的形式,所以本題要解決的問題是:以提升業務員的收入

 解答思路:

收入=房間數×轉化率×房間單價

先看整體水平,先算一下全國收入的平均數,然後分兩撥,哪些比平均數低,在具體看哪些城市比平均值低,好的能做到多少

整體立一個標杆,到時候考覈就有標準。

差的標識出來,差的少做,好的多做,那麼好的多做多少?

即加量=>需要加多少?

假如砍了100家不好的店,這100家的入住率爲10%,那麼就需要補10家好的店

但如果補的店沒人來怎麼辦,這個時候就需要測算預計訂房的用戶有多少

未做但有潛力做的:

考察要點:正面回答問題

好多同學繞到入住率上去了,然而入住率是否和收入畫等號呢?

理論上直接把差的房型淘汰掉,也能提高入住率哈

圍繞問題組織答案!

題後思考∶如何把一個具體的業務動作轉化爲數據問題

業務員是怎麼找的?怎麼識別好壞?

業務員有多少精力?每天能跑多少點?

業務員有多少資本?談判還能加什麼籌碼?

邁不開腿,張不開嘴的數據分析師,就等着月薪6000取數取一輩子吧

十六、報表意見收集問題

領導準備清理報表,爲明年增刪改做準備,讓發個問卷問一下各部門意見

問:問卷如何設計,如何發?

看起來似乎很簡單,但是直接問:“你還用不用?”多簡單?

但是,有人填嗎?

有人填有人不填怎麼辦?

領導填的和員工填的不一樣怎麼辦?

解題思路:

給老闆呈現問卷:

 

 內部統計思路:

考察要點:內外部數據結合

實際上,常用的數據經常包含系統記錄數據與用戶自填數據兩部分呢

系統數據多,但不活躍用戶,無交易用戶佔大多數

用戶自填,粉絲填的多,緣邊用戶填的少也是常識

粗暴丟掉某些羣體的數據都會引發錯誤判斷

根據目標組織數據,最大程度合理利用數據

題後思考:

我們分析的數據真的那麼可靠嗎

整體結構比嬌嫩的模型更能反映問題

數據質量提升本身是個無止境的工作

不考慮數據質量的算法都是耍流氓

十七、戰敗用戶的問題

問題:瓜子二手車,面試直接問︰如何挽留戰敗用戶

是滴!正確反應是先問∶什麼是戰敗用戶,要先覈對統計口徑。

因爲用戶流失是分若干個階段的,而且二手車的行業基本是一錘子買賣,基本一買之後就是3、5年,之後瓜子二手車還在不在都是問題

解題思路:流程

到底用戶是在哪個步驟流失的?

話說到底人家有幾個步驟啊??

  需要自己下載個app試上一試自己就知道了

搞清楚流程,是定位問題的關鍵

縱向流程:

橫向流程:

考察要點:流程理解

爲什麼漏斗圖那麼流行,經常用?

因爲漏斗圖是一種符合MECE原則的診斷問題的模式

先定義清楚是什麼?才能進—步探討爲什麼、做什麼

探討是什麼,站在全局角度思考,免得被帶歪節奏

題後思考:皮,是什麼被扯起來的?

大部分扯皮源自指東說西、抓小放大、顧一忘二、

指東說西∶你談人員服務,他談產品設計

抓小放大︰你說服務不好顧客會流失,他說就有服務不好也買的

顧一忘二:你說這裏有三個問題,他說都是扯得我看就一個本質問題

所以,想不扯皮,把全流程劃上,每一步問題有哪些問題,預計影響多少都標上去,是最靠譜的辦法。

十八、渠道商提貨問題

B2B企業,有5000家下游經銷商的提貨數據,沒有經銷商的銷售數據,沒有最終用戶信息,是滴,只有提貨數據,問怎麼分析?

考察要點:理解業務模式

理解B2B的業務模式是根本,希望大家通過本例,有了一定的認識

如果不能最終診斷問題,就先定義問題

數據分析基本思路:是什麼,爲什麼,做什麼

先解決是什麼,爲什麼的問題就更容易解決

題後思考:當數據不足的時候怎麼辦

如果數據不足,主動思考∶我還要什麼數據才能解決問題

不要光盯着眼前的數,還有數據來源和統計方式

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章