瞭解大數據的特點、來源與數據呈現方式

1.瀏覽2019春節各種大數據分析報告,例如:

2.這些分析所採用數據的來源是什麼?

  1) 交易數據。包括 POS 機數據、信用卡刷卡數據、電子商務數據、互聯網點擊數據、“企業資源規劃”(ERP)系統數據、銷售系統數據、客戶關係管理 (CRM) 系統數據、公司的生產數據、庫存數據、訂單數據、供應鏈數據等。

  2) 移動通信數據。能夠上網的智能手機等移動設備越來越普遍。移動通信設備記錄的數據量和數據的立體完整度,常常優於各家互聯網公司掌握的數據。移動設備上的軟件能夠追蹤和溝通無數事件,從運用軟件儲存的交易數據 (如搜索產品的記錄事件) 到個人信息資料或狀態報告事件 (如地點變更即報告一個新的地理編碼) 等。

  3) 人爲數據。人爲數據包括電子郵件、文檔、圖片、音頻、視頻,以及通過微信、博客、推特、維基、臉書、Linkedin 等社交媒體產生的數據流。這些數據大多數爲非結構性數據,需要用文本分析功能進行分析。

  4) 機器和傳感器數據。來自感應器、量表和其他設施的數據、定位/ GPS 系統數據等。這包括功能設備會創建或生成的數據,例如智能溫度控制器、智能電錶、工廠機器和連接互聯網的家用電器的數據。來自新興的物聯網(IoT) 的數據是機器和傳感器所產生的數據的例子之一。來自物聯網的數據可以用於構建分析模型,連續監測預測性行爲 (如當傳感器值表示有問題時進行識別),提供規定的指令 (如警示技術人員在真正出問題之前檢查設備)等。

  5) 互聯網上的“開放數據”來源,如政府機構,非營利組織和企業免費提供的數據。

3.大數據的呈現方式有哪些?

 

(1)將指標數值化  (2)將指標圖形化  (3)將指標關係圖形化  (4)將時間和空間可視化  (5)將數據進行概念轉換   (6)讓圖表”動“起來

 

4.大數據的特點是什麼?對思維方式有何影響?

   大數據有4個特點,爲別爲:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)分別對應爲:

1、數據量大

    人類社會產生的數據每兩年就增加一倍——“大數據摩爾定律”。

2、數據類型繁多

    大數據的數據類型豐富,包括結構化數據和非結構化數據,其中,結構化數據佔10%左右,主要是指存儲在關係數據庫中的數據;後者佔90%左右,種類繁多,主要包括郵件、音頻、視頻、微信、微博、位置信息、鏈接信息、手機呼叫信息、網絡日誌等。

3、處理速度快

    數據處理和分析的速度通常要達到秒級響應。

4、價值密度低

    在大數據時代,很多有價值的信息都是分散在數據海量中的。譬如監控視頻,平時可能沒有什麼作用,但當發生盜竊事件時,只有記錄了案發時刻的那一段視頻是有用的。

 

大數據對思維方式的影響:

(1)人們處理的數據從單一樣本數據變成全量數據(全樣本數據);

(2)由於是海量數據和全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;

(3)人類通過對大數據的處理,放棄對因果關係的渴求,轉而關注相關性關係(即數據的關聯性關係)。

 

課後小故事代碼:

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章