對於一些新手朋友來說,剛接觸大數據不知從何學起,首先先了解下什麼是大數據?大數據(big data,mega data),或稱巨量資料,指的是需要新處理模式才
能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數
據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據進行分析處理。大數據的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密
度)、Veracity(真實性)。
簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向衆多企業的潛力。
大數據的5個“V”,或者說特點有五層面:
第一,數據體量巨大
從TB級別,躍升到PB級別。
第二,數據類型繁多
前文提到的網絡日誌、視頻、圖片、地理位置信息等等。
第三,價值密度低
以視頻爲例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。
第四,處理速度快
1秒定律。最後這一點也是和傳統的數據挖掘技術有着本質的不同。業界將其歸納爲4個“V”——Volume,Variety,Value,Velocity。
物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍佈地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。
下面附上一張大數據學習路線圖,僅供大家參考!
在這裏相信有許多想要學習大數據的同學,大家可以+下大數據學習裙:716加上【五8一】最後014,即可免費領取大數據學習教程探討學習。