1.瀏覽2019春節各種大數據分析報告,例如:
- 這世間,再無第二個國家有能力承載如此龐大的人流量。http://www.sohu.com/a/290025769_313993
- 春節人口遷徙大數據報告!http://www.sohu.com/a/293854116_679156
- 春節大數據:消費首破萬億 最佳伴手禮竟是教輔書?
- http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
- 大數據中的春節http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
- 春節年味大數據都有啥 90後年味就是搶紅包http://news.zol.com.cn/708/7087625.html
- 春節大數據出爐
- http://www.sohu.com/a/223982938_100012490
- 2019年微信春節大數據:收發紅包人數超8億
- http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html
2.這些分析所採用數據的來源是什麼?
1) 交易數據。包括 POS 機數據、信用卡刷卡數據、電子商務數據、互聯網點擊數據、“企業資源規劃”(ERP)系統數據、銷售系統數據、客戶關係管理 (CRM) 系統數據、公司的生產數據、庫存數據、訂單數據、供應鏈數據等。
2) 移動通信數據。能夠上網的智能手機等移動設備越來越普遍。移動通信設備記錄的數據量和數據的立體完整度,常常優於各家互聯網公司掌握的數據。移動設備上的軟件能夠追蹤和溝通無數事件,從運用軟件儲存的交易數據 (如搜索產品的記錄事件) 到個人信息資料或狀態報告事件 (如地點變更即報告一個新的地理編碼) 等。
3) 人爲數據。人爲數據包括電子郵件、文檔、圖片、音頻、視頻,以及通過微信、博客、推特、維基、臉書、Linkedin 等社交媒體產生的數據流。這些數據大多數爲非結構性數據,需要用文本分析功能進行分析。
4) 機器和傳感器數據。來自感應器、量表和其他設施的數據、定位/ GPS 系統數據等。這包括功能設備會創建或生成的數據,例如智能溫度控制器、智能電錶、工廠機器和連接互聯網的家用電器的數據。來自新興的物聯網(IoT) 的數據是機器和傳感器所產生的數據的例子之一。來自物聯網的數據可以用於構建分析模型,連續監測預測性行爲 (如當傳感器值表示有問題時進行識別),提供規定的指令 (如警示技術人員在真正出問題之前檢查設備)等。
5) 互聯網上的“開放數據”來源,如政府機構,非營利組織和企業免費提供的數據。
3.大數據的呈現方式有哪些?
(1)將指標數值化 (2)將指標圖形化 (3)將指標關係圖形化 (4)將時間和空間可視化 (5)將數據進行概念轉換 (6)讓圖表”動“起來
4.大數據的特點是什麼?對思維方式有何影響?
大數據有4個特點,爲別爲:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)分別對應爲:
1、數據量大
人類社會產生的數據每兩年就增加一倍——“大數據摩爾定律”。
2、數據類型繁多
大數據的數據類型豐富,包括結構化數據和非結構化數據,其中,結構化數據佔10%左右,主要是指存儲在關係數據庫中的數據;後者佔90%左右,種類繁多,主要包括郵件、音頻、視頻、微信、微博、位置信息、鏈接信息、手機呼叫信息、網絡日誌等。
3、處理速度快
數據處理和分析的速度通常要達到秒級響應。
4、價值密度低
在大數據時代,很多有價值的信息都是分散在數據海量中的。譬如監控視頻,平時可能沒有什麼作用,但當發生盜竊事件時,只有記錄了案發時刻的那一段視頻是有用的。
大數據對思維方式的影響:
(1)人們處理的數據從單一樣本數據變成全量數據(全樣本數據);
(2)由於是海量數據和全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;
(3)人類通過對大數據的處理,放棄對因果關係的渴求,轉而關注相關性關係(即數據的關聯性關係)。
課後小故事代碼: