大數據的特性優勢有哪些

  大數據的出現給許多企業對尋找未來的方向帶來了巨大的幫助,許多企業開始關注大數據,現在很多人開始關注大數據,大數據可以給每個人帶來幫助,但你知道大數據的特點和功能嗎?

大數據的特性優勢有哪些

 

  大數據的特性都有哪些

 

  一、體量(Volume)

 

  大數據由大量數據組成,從幾個TB到幾個ZB。這些數據可能會分佈在許多地方,通常是在一些連入因特網的計算網絡中。一般來說,凡是滿足大數據的幾個V的條件的數據都會因爲太大而無法被單獨的計算機處理。單單這一個問題就需要一種不同的數據處理思路,這也使得並行計算技術(例如MapReduce)得以迅速崛起。

 

  二、高速(Velocity)

 

  大數據是在運動着的,通常處於很高的傳輸速度之下。它經常被認爲是數據流,而數據流通常是很難被歸檔的(考慮到有限的網絡存儲空間,單單是高速就已經是一個巨大的問題)。這就是爲什麼只能收集到數據其中的某些部分。如果我們有能力收集數據的全部,長時間存儲大量數據也會顯得非常昂貴,所以週期性的收集數據遺棄一部分數據以節省空間,僅保留數據摘要(如平均值和方差)。這個問題在未來會顯得更爲嚴重,因爲越來越多的數據正以越來越快的速度所產生。

 

  三、多樣(Variety)

 

  在過去,數據或多或少是同構的,這種特點也使得它更易於管理。這種情況並不出現在大數據中,由於數據的來源各異,因此形式各異。這體現爲各種不同的數據結構類型,半結構化以及完全非結構化的數據類型。結構化數據多被發現在傳統數據庫中,數據的類型被預定義在定長的列字段中。半結構化數據有一些結構特徵,但不總是保持一致(舉例來說,看一看JSON文件),使得這種類型難以處理。更富於挑戰的是非結構化數據(例如純文本文件)毫無結構特徵可言。在大數據中,更常見的是半結構化數據,而且這些數據源的數據格式還各不相同。

 

  在過去的幾年裏,半結構化數據和結構化數據成爲了大數據的主體數據類型。

 

  四、準確(Veracity)

 

  這是一個在討論大數據時時常被忽略的一個屬性,部分原因是這個屬性相對來說比較新,儘管它與其他的屬性同樣重要。這是一個與數據是否可靠相關的屬性,也就是那些在數據科學流程中會被用於決策的數據。

 

  五、精確性與信噪比(signal-to-noiseratio)

 

  在大數據中發現哪些數據對商業是真正有效的,這在信息理論中是個十分重要的概念。由於並不是所有的數據源都具有相等的可靠性,在這個過程中,大數據的精確性會趨於變化。如何增加可用數據的精確性是大數據的主要挑戰。注意,即使有些數據擁有這4種屬性中的一種或多種,也不能被歸類爲大數據。大數據擁有以上全部4種特性。大數據是一個重要課題,因爲它並不容易處理,即使是對於一臺超級計算機,也很難獨自有效地展開分析。

 

  大數據的處理和分析正在成爲新一代信息技術融合和應用的節點,大數據是信息產業持續快速增長的新引擎,大數據利用將成爲提高核心競爭力的關鍵因素。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章