hadoop(大數據簡介)

大數據概念:

概念:
大數據(Big Data):指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
主要解決:
海量數據的存儲和海量數據的分析計算問題。

大數據特點(4V)

  1. Volume(大量)
    截至目前,人類生產的所有印刷材料的數據量是200PB,而歷史上全人類總共說過的話的數據量大約是5EB。當前,典型個人計算機硬盤的容量爲TB量級,而一些大企業的數據量已經接近EB量級。
  2. Velocity(高速)
    這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的“數字宇宙”的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。
  3. Variety(多樣)
    這種類型的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於存儲的以數據庫/文本爲主的結構化數據,非結構化數據越來越多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
  4. Value(低價值密度)
    價值密度的高低與數據總量的大小成反比。如何快速對有價值數據“提純”成爲目前大數據背景下待解決的難題。

大數據應用場景

  1. 物流倉儲
    大數據分析系統助力商家精細化運營,提升銷量、節約成本
  2. 零售
    分析用戶消費習慣,爲用戶購買商品提供方便,從而提升商品銷量
    例如:紙尿褲+啤酒
  3. 商品廣告推薦
    給用戶推薦可能喜歡的商品
  4. 保險金融房產
  5. 人工智能

大數據部門組織結構
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章