【Hadoop技術】【大數據概論】

一、大數據概念

大數據就是巨量的數據。大數據的計量單位已經超過TB級別發展到PB、EB、ZB、YB甚至BB級別。
大數據是指在一定時間內無法使用傳統數據庫軟件工具採集、存儲、管理和分析其內容的數據集合。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對於這些含有意義的數據進行專業化處理。

二、大數據5大特點

大數據具有5各方面的特點,規模性(Volume)、多樣性(Variety)、高速性(Velocity)、價值性(Value)、真實性(Veracity)。
在這裏插入圖片描述

2.1 規模性

數據規模大
在這裏插入圖片描述

2.2 多樣性

大數據可以分爲三類:

1.結構化數據,指可以使用關係型數據庫表示和存儲,表現爲二維形式的數據。一般特點是:數據以行爲單位,一行數據表示一個實體的信息,每行數據的屬性是相同的。
2.非結構化數據,指的是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二位邏輯表來表現得數據。
3.半結構化數據,是結構化數據的一種,不符合關係型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。因此,它也被稱爲自描述的結構。半結構化數據,屬於同一類實體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序並不重要。

結構化數據佔比比較大,但是產生價值的往往是這些非結構哈u數據。

2.3 高速性

數據的增長速度和處理速度是大數據高速性的重要體現。
海量數據的背後帶來的是更大的挑戰,即如何快速計算分析大數據成爲當下熱門的話題。

2.4 價值性

大數據的核心特徵是價值。價值密度的高低和數據總量的大小是成反比的,即數據價值密度越高數據總量越小,數據價值密度越低數據總量越大。

2.5 真實性

真實性就是數據的質量。

三、大數據應用場景

3.1 電商大數據

精準營銷法寶
在這裏插入圖片描述

3.2 金融大數據

大數據在金融行業的應用可以總結一下五個方面:精準營銷、風險管控、決策支持、效率提升以及產品設計。
在這裏插入圖片描述

3.3 醫療大數據

在這裏插入圖片描述

3.4 零售大數據

瞭解客戶消費喜好和趨勢,進行商品的精準營銷,降低營銷成本。依據客戶購買產品,爲客戶提供可能購買的其他產品,擴大銷售額,也屬於精準營銷範疇。
在這裏插入圖片描述

3.5 交通大數據

在這裏插入圖片描述

3.6 輿情監控大數據

在這裏插入圖片描述

四、業務流程分析

1.產品人員提需求:統計總用戶數、日活躍用戶數、迴流用戶數等
2.數據部門搭建數據平臺、分析數據指標
3.數據可視化(報表展示、郵件發送、Echarts)

下一篇:【Hadoop技術】【Hadoop快速入門】

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章