數據分析學習筆記+案例實操

學習資源來自:
刺蝟大學:刺蝟大學數據分析體驗營

學習筆記


第一講:認識數據分析
why量化、客觀分析,輔助決策
what戰略層面、用戶精準營銷等
how數據分析方法
第二講:八大實用數據分析模型
1行爲事件分析:5W1H
2漏斗分析:各標誌點用戶轉化率
3留存分析:留存率,延長用戶生命週期
4分佈分析:數據分析第一步要做的,重要
5點擊分析:電商應用較多
6用戶路徑:獲取用戶偏好
7用戶分羣:精準營銷,機器學習分類,勾勒用戶畫像
8屬性分析:瞭解用戶特點
第三講:可視化工具介紹
1爲什麼需要可視化?現在數據量巨大,而大腦對圖像信息處理快
2商業智能:數據庫-數據分析-可視化,實現商業價值;“智能”在於可以實現動態交互
3Tableau商業智能工具平臺
優點:可以實時分享
類型:圖表、儀表盤、故事
學習目的:Excel數據處理,Tableau完成可視化
4數據爬蟲:八爪魚
分享一個自己用過的爬蟲軟件:集搜客(官網https://www.jisouke.com/,和導師一起完成的視頻教程https://www.jianshu.com/p/cfabdc81f2d3
第四講:寫代碼分析數據
1傳統數據分析工作者:Excel(報表)+PPT(報告+排版)
2SQL是一種編程語言
優點:數據處理高效
缺點:不能深度運算和建模
3Python
優點:基本語法功能不難;開源工具包(交互式圖表-pyechars,matpotlib-seaborn,Gephi-關係網絡可視化);數據爬蟲

案例實操


在這裏插入圖片描述
案例實操1(1):某時間段內廣告投放人羣記錄(樹狀圖)-圖1
重點:
1vlookup匹配分組
2兩個維度樹狀圖(把維度多的做小一點維度,eg.男女用顏色、位置表示,年齡七個維度表示成方塊大小)
步驟:
1年齡數據匹配:=VLOOKUP(要匹配單元格,匹配區域($絕對引用,快捷鍵F4),匹配列,FALSE(精確匹配))-雙擊小方框填充所有-粘貼值
2刪除空值(性別):開始-查找和選擇-定位條件-空值-刪除整行
3去重(用戶id):數據-刪除重複項-選定用戶id
4數據彙總:插入-數據透視表-拖動字段,設計-分類彙總(不顯示分類彙總)-報表佈局(以表格形式顯示、重複所有項目標籤)
5做樹狀圖:粘貼值,插入-樹狀圖,更改標題-調整配色(用PPT取色器,配色網站https://www.webdesignrankings.com/resources/lolcolors/
案例實操1(2):多維度分析廣告投放影響因素-圖2
步驟:
1去重(用戶id)
2定位空值,填充爲“未知”(批量填充Ctrl+Enter)
3替換“是否點擊”分別爲“1,0”
4分別做數據透視表進行可視化
5粘貼值-調整格式
案例實操2:商品列表(氣泡圖)-圖3、圖4
重點:
1時間戳真實事件含義
2氣泡圖的含義(散點圖的一種):三組數值之間的關係
3投放廣告頻率:一段時間內投放的廣告次數
步驟:
1商品價格匹配:VLOOKUP(全選表格Shift+Ctrl+下鍵)
2處理時間戳:換算成天(用除法)-鍵入原始時間(重複填充:複製單元格-選中兩個相同的雙擊小方框)-得出當前時間(天+原始時間)(驗算工具https://www.timestampconvert.com/)-粘貼值(設置單元格格式:日期)
3設置時間段(一般顯示小時或天的投放次數):=HOUR(要提取時間段單元格)(設置單元格格式:常規)
4填充空值爲“未知”
5數據彙總:數據透視圖(去掉空白:下拉菜單去掉勾選)
6做圖:散點圖-氣泡圖(設置數據系列格式:調整氣泡麪積,添加座標軸標題和圖例:選擇數據-編輯系列名稱)
案例實操3:用戶行爲(帕累託圖)-圖5
重點:
使用次座標軸
步驟:
1處理時間戳
2數據彙總:數據透視表(只統計某一行爲:“行動”放在“篩選器”,更改複製數據)
3做圖:簇狀柱形圖(原理:先繪製一種行爲-通過添加數據源增加數據可視化)-更改系列圖表類型:可選次座標軸

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章