1. 什麼是大數據?
字面意思理解:大量的數據,海量的數據
數據集的大小已經遠遠超過了現有普通數據庫軟件和工具的處理能力的數據
2. 大數據有什麼特點?
1.海量化
數據量大(多)
2.多樣化
結構化數據,半結構化數據,和非結構化數據
3.快速化
數據的增長速度快
4.高價值
海量數據價值高
3. 大數據能做什麼?
1.海量數據快速查詢
2.海量數據的存儲(數據量大,單個大文件)
3.海量數據的快速計算(與傳統的工具對比)
4.海量數據實時計算(立刻馬上)
5.數據挖掘(挖掘以前沒有發現的有價值的數據)
4. 大數據項目流程
1.數據的生產 --> 2.數據採集 --> 3.數據存儲 --> 4.需求分析 --> 5.數據預處理
--> 6.數據計算 --> 7.結果數據存儲 --> 8.結果數據展現