原创 商業需求分析思維導圖

根據一個培訓視頻整理而來

原创 數據分析の杜邦分析法

好了,杜邦分析法在財務上是把淨資產收益率作爲一個總指標,然後對其進行分解成分其他財務指標,以此來評估企業的財務狀況和經營業績。  淨資產收益率主要分解爲一下三部分: 權益乘數:反映企業的負債狀況,涉及到資產負債率,即總負債與總資產的比率。

原创 數據分析報告思維導圖

   

原创 數據分析常用的方法論

數據分析需要以營銷或管理的理論作爲支撐,其中涉及到的理論模型大致有: 一、營銷理論模型: 4P模型,即Product 產品,Price 價格,Place 渠道,Promotion 促銷。4P理論一般用於分析公司整體的經營環境。 用戶使用行

原创 互聯網數據分析指標體系

互聯網行業有各種各樣的指標,我嘗試着將他們歸納到一個思維導圖裏面,但有些指標可能同時屬於多種類型,比如說,跳出率,可以是用戶行爲的指標,也可以網站運營的指標。 下面的圖參考了一些文章,做了一個初步的歸納,慢慢再完善。  

原创 DataWhale 組隊學習MySQL 任務三

項目十: 各部門工資最高的員工(難度:中等) 創建Employee 表,包含所有員工信息,每個員工有其對應的 Id, salary 和 department Id。 +----+-------+--------+-------------

原创 DataWhale 組隊學習數據挖掘實踐 任務四 和 五 模型調優 和 K折交叉驗證

任務5:使用網格搜索法對5個模型進行調優(調參時採用五折交叉驗證的方式),並進行模型評估,記得展示代碼的運行結果。 注: 由於時間限制,這裏的任務我只做SVM的先吧   導入必要的包 # 最優參數選擇 from sklearn.mod

原创 DataWhale 組隊學習數據挖掘實踐 任務六

模型融合方式任意,並結合Task5給出你的最優結果。 例如Stacking融合,用你目前評分最高的模型作爲基準模型,和其他模型進行stacking融合,得到最終模型及評分結果。 模型融合沒學過,先跟着網上的教程做一遍,待花時間再好好研究一

原创 DataWhale 組隊學習MySQL 任務四 正在做。。。

  項目十六 分數排名 (難度:中等) 依然是昨天的分數表,實現排名功能,但是排名需要是非連續的,如下: +-------+------+ | Score | Rank | +-------+------+ | 4.00 | 1 | |

原创 DataWhale 組隊學習數據挖掘實踐 任務三

任務3 - 建模 用邏輯迴歸、svm和決策樹;隨機森林和XGBoost進行模型構建,評分方式任意,如準確率等。(不需要考慮模型調參) 一、 使用邏輯迴歸 from sklearn.linear_model import SGDClass

原创 DataWhale 組隊學習MySQL 任務二

  項目三:超過5名學生的課(難度:簡單) 創建如下所示的courses 表 ,有: student (學生) 和 class (課程)。 例如,表: +---------+------------+ | student | class 

原创 DataWhale 組隊學習爬蟲 Task2

任務描述: 2.1 學習beautifulsoup 學習beautifulsoup,並使用beautifulsoup提取內容。 使用beautifulsoup提取丁香園論壇的回覆內容。 丁香園直通點:http://www.dxy

原创 DataWhale 組隊學習爬蟲 Task2 補充(爬取微博)

1. 首先,我們要把電腦網頁版的微博頁面在流浪器中轉爲手機端的頁面,這裏最好使用谷歌瀏覽器,按F12,點擊下面按鈕變成手機端模式: 然後搜索並進入新浪微博,在微博搜索欄搜索LYH,點擊頭像進去他的主頁:   2. 在Network功能