大數據分析是個什麼鬼

一. 什麼是數據,數據有哪些表現形式?

數據是指不同的信息片段,數據的形式多樣,從文本到視頻再到電子表格,從數據庫到圖片再到音頻,等等

 

二. 數據分爲哪兩大類?

數值數據:(可以進行計算)可以分爲連續數據和離散數據

分類數據:(用來標記一個羣體或一組條目)可以分爲定類數據和定序數據

 

三.數據分析的過程是什麼?

提出問題、整理數據、探索數據、得出結論、進行交流

1. 收集數據;

2. 評估數據是否有質量或結構問題;

3. 清理數據從而保證數據集質量高結構好;

4. 探索分析將可視化界面和模型的潛力最大化

5. 得出結論並進行預測

 

四. 在分析離散數值數據和連續數值數據,我們通常會討論以下四個方面:

集中趨勢、離散程度、形狀和異常值

 

五. 集中趨勢的測量方法:平均數、中位數、衆數

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章