markdown
數據分析全景圖
學習一門知識,應該儘可能從多個角度對其進行認識。
數據分析的組成
數據分析由三個部分組成:
- 數據採集
- 數據挖掘: **數據分析中商業價值的所在。數據挖掘的核心是挖掘數據的商業價值,即人們常談的商業智能 BI**
- 數據可視化
三個組成部分的圖片展示:
- 數據採集
- 數據挖掘
需要掌握常用的十大算法,這十大算法可以分爲四類:
類別 | 具體算法名 |
---|---|
分類算法 | 決策樹(ID3、C4.5、CART)樸素貝葉斯、 SVM、KNN、Adaboost |
聚類算法 | K-Means, EM |
關聯分析 | Apriori |
連接分析 | PageRank |
- 數據可視化
常用的數據可視化方法:
第一種:使用Python, eg: Matplotlib, Seaborn
第二種:使用第三方工具,已經生成了csv格式文件,想要採用所見即所得的方式進行呈現,可以採用微圖、DataV、Data GIF Maker等第三方工具。
數據採集和數據可視化的原理簡單,重點是在工具的掌握。通過實操練習來進行掌握。
經驗者說: 學習數據分析最好的方法是:在工具中靈活運用,在項目中加深理解。