一. 什麼是數據,數據有哪些表現形式?
數據是指不同的信息片段,數據的形式多樣,從文本到視頻再到電子表格,從數據庫到圖片再到音頻,等等
二. 數據分爲哪兩大類?
數值數據:(可以進行計算)可以分爲連續數據和離散數據
分類數據:(用來標記一個羣體或一組條目)可以分爲定類數據和定序數據
三.數據分析的過程是什麼?
提出問題、整理數據、探索數據、得出結論、進行交流
1. 收集數據;
2. 評估數據是否有質量或結構問題;
3. 清理數據從而保證數據集質量高結構好;
4. 探索分析將可視化界面和模型的潛力最大化
5. 得出結論並進行預測
四. 在分析離散數值數據和連續數值數據,我們通常會討論以下四個方面:
集中趨勢、離散程度、形狀和異常值
五. 集中趨勢的測量方法:平均數、中位數、衆數