大數據概念:
概念:
大數據(Big Data):指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
主要解決:
海量數據的存儲和海量數據的分析計算問題。
大數據特點(4V)
- Volume(大量)
截至目前,人類生產的所有印刷材料的數據量是200PB,而歷史上全人類總共說過的話的數據量大約是5EB。當前,典型個人計算機硬盤的容量爲TB量級,而一些大企業的數據量已經接近EB量級。- Velocity(高速)
這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的“數字宇宙”的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。- Variety(多樣)
這種類型的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於存儲的以數據庫/文本爲主的結構化數據,非結構化數據越來越多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。- Value(低價值密度)
價值密度的高低與數據總量的大小成反比。如何快速對有價值數據“提純”成爲目前大數據背景下待解決的難題。
大數據應用場景
- 物流倉儲
大數據分析系統助力商家精細化運營,提升銷量、節約成本- 零售
分析用戶消費習慣,爲用戶購買商品提供方便,從而提升商品銷量
例如:紙尿褲+啤酒- 商品廣告推薦
給用戶推薦可能喜歡的商品- 保險 、金融 、房產
- 人工智能
大數據部門組織結構