網易數據分析師面試準備

1.項目分析的步驟

理解問題
探索數據
準備數據用於建模
建模
測試
上線執行並追蹤

2. 如何處理缺失數據?(如果缺失的數據不可得,將採用何種手段收集?)

首先判斷缺失數據是否有意義,如果沒有意義或者缺失數據的比例超過80%直接去掉。如果缺失數據有規律,則需根據其變化規律來推測次缺失值;如果數據沒有規律,則用其他值代替:
如果數據符合正態分佈,缺失值用期望值代替
如果數據是類型變量,則用默認類型值代替缺失值
這裏寫圖片描述


3.邏輯斯蒂迴歸和線性迴歸的區別

邏輯斯蒂迴歸的預測值是兩元的,0或1;而線性迴歸的預測值是連續的。


4.說說你對數據分析的理解

數據分析是基於商業目的,有目的的進行收集、整理、加工和分析數據,提煉有價信息的一個過程。
(1)明確分析目的與框架
(2)數據收集
(3)數據處理:主要包括數據清洗、數據轉化等處理方法。
(4)數據分析:指通過分析手段、方法和技巧對準備好的數據進行探索、分析,從中發現因果關係、內部聯繫和業務規律,爲商業目提供決策參考。
(工具和方法的使用:其一要熟悉常規數據分析方法,最基本的要了解例如方差、迴歸、因子、聚類、分類、時間序列等多元和數據分析方法的原理、使用範圍、優缺點和結果的解釋;其二是熟悉數據分析工具,Excel是最常見,一般的數據分析我們可以通過Excel完成,後而要熟悉一個專業的分析軟件。)
(5)數據展現:通過圖、表的方式來呈現
(6)撰寫報告:將數據分析的目的、過程、結果及方案(結論、建議、解決方案)完整呈現出來,以供商業目的提供參考。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章