對於“大數據”的15條幹貨思考分享

具體來說,要實現大數據的核心價值,還需要前兩個重要的步驟,第一步是通過“衆包”的形式收集海量數據,第二步是通過大數據的技術途徑進行“全量數據挖掘”,最後利用分析結果進行“資源優化配置”。本篇文章講述了關於“大數據”的15條幹貨分享,認真閱讀肯定會學習到非常有用的知識的,大家快認真閱讀吧~

      1.馬雲創造了“DT”(大數據時代)這個詞,說未來社會不是IT時代,而是DT時代,而阿里巴巴戰略定位爲做DT時代的基礎設施。類似於IT時代的微軟,移動互聯網時代的蘋果之類的意思。馬雲去年在雲棲大會上提出未來30年的“五個新”,分別是“新零售,新制造,新金融,新技術,新能源”,其中“新能源”就是大數據,其討論的相對比較少,似乎公衆只關心的是公民數據安全問題,對於產業方面的大數據覺得比較抽象,實際上真正的“大數據”與阿里戰略更爲密切。

對於“大數據”的15條幹貨思考分享_數據_系統_互聯網_課課家教育

  大數據特點:

  大數據分析相比於傳統的數據倉庫應用,具有數據量大、查詢分析複雜等特點。《計算機學報》刊登的“架構大數據:挑戰、現狀與展望”一文列舉了大數據分析平臺需要具備的幾個重要特性,對當前的主流實現平臺——並行數據庫、MapReduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。

業界將其歸納爲4個“V”——Volume(數據體量大)、Variety(數據類型繁多)、Velocity(處理速度快)、Value(價值密度低)。

      大數據的4個“V”,或者說特點有四個層面:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日誌、視頻、圖片、地理位置信息等等。第三,處理速度快,1秒定律,可從各種類型的數據中快速獲得高價值的信息,這一點也是和傳統的數據挖掘技術有着本質的不同。第四,只要合理利用數據並對其進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納爲4個“V”——Volume(數據體量大)、Variety(數據類型繁多)、Velocity(處理速度快)、Value(價值密度低)。

  從某種程度上說,大數據是數據分析的前沿技術。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向衆多企業的潛力。

大數據最核心的價值就是在於對於海量數據進行存儲和分析。

     大數據最核心的價值就是在於對於海量數據進行存儲和分析。相比起現有的其他技術而言,大數據的“廉價、迅速、優化”這三方面的綜合成本是最優的。

      2. 最早把大數據應用在商業上的是亞馬遜,直接根據用戶的閱讀興趣推薦與之相關書籍,人家在PC時代就這麼幹了,是《大數據時代:生活、工作與思維大變革》一書中的經典案例;而在無線互聯網時代的,今日頭條根據用戶閱讀點擊行動來形成個性化標籤的“千人千面”,成爲應用用戶大數據的新樣板;二者之間是不是有一些相似呢?

  3. 手機正把一切都數據化,自從蘋果做機身一體化以外,現在國產手機的電池都不可拆卸了,即使手機關機,也可以定位到,這個功能給軍事、刑偵帶來便利,比如以前兒童走失尋回機率很小,如今有了跟蹤功能,大家看支付寶、滴滴出行、今日頭條會推動這一方面消息成功率明顯提升了很多,對犯罪分子具有很強的威懾力,很多崗位因爲數據的力量實際上更加“實證化”了,在這種局面下,做一個好人會更多回報,而做一個壞人會得到更大的懲罰,這是社會昌明的前兆。

  4. 手機裏的數據可以實時上傳到“雲”上,如果數據沒有“在線”,就不是所謂的大數據,而大數據與“雲服務”是孿生兄弟,數據在線化需要存儲、訪問、下載,以前做數據存儲是追求存儲的空間大,就像手機的內存、電腦的硬盤、機房的服務器一樣,當一切都數據化之後,盲目追求物理存儲量顯然行不通了,所以要轉上“雲”,也就是在線化了,(聽說這個與“馬雲”爸爸的名字相關)。要用“在線”的思維去理解大數據,而不是停留在海量的直觀上。

  5. 雲服務也是亞馬遜的AWS最早做公有云,IT企業不必向以前自建機房了,使用亞馬遜的雲服務,等於亞馬遜爲大家建了一個雲服務的平臺,這也就從IaaS(基礎即服務)轉向了PaaS(應用即服務)。在亞馬遜做了雲服務之後,阿里也做了阿里雲,比如我所瞭解的智能鎖品牌果加+、曼申、小嘀等,都是使用阿里雲的服務,很多的SaaS軟件也是購買的阿里雲,阿里雲目前穩坐企業服務市場的頭把交椅,形成了網絡效益。

  6. SaaS(企業即服務軟件)之所以火也與雲服務相關,是在移動端可以直接下載App軟件,有的連PC端系統都沒有了,SaaS與ERP的區別是,SaaS是雲端化下載、再安裝,產品也更加標準化;而此前的ERP是固定的裝機。現在SaaS比較多,似乎每個職能部門都有對立的SaaS,以便於提升創業者的人效。缺點是SaaS實在太多,有些碎片化,應該會出現一個類似微信一樣的“統一型的企業軟件”,成爲企業管理中的“瑞士軍刀”,看在阿里是有to B的基因上,我大膽預測是阿里釘釘。

  7. 一切都在數據化,並不是意味着所有的數據都有用,比如百度積累了很多年的搜索數據,需要“結構化”之後才能定向地分發信息;百度糯米的O2O數據目前的商業價值,還沒有完全釋放出來,還需要“雲計算”能力跟上來。幾乎所有的應用Push信息都比較煩人,說明大數據的場景化還很不成熟。

  8. 除了積累數據之外,互聯網巨頭都在瘋狂購買或兼併數據,目前,現在數據的流通和交換還處於相對初期的階段。數據使用之後可以不像實物會折舊損耗,還可以繼續用,其數據結構化更強,反而增加了價值。目前市場上的數據很多還是在諮詢公司或互聯網公司手中,並沒有很好發揮數據共享的作用,總體來看,數據的壁壘和鴻溝還很大。

  9. 要想首先解決數據開放問題,指望互聯網公司開放似乎不大現實,人家的數據積累的好辛苦,都是資本的血汗錢。可行的是政府把自己的大數據開放出來,比如啓信寶就是把工商稅務數據進行結構化分類,產品體驗做好形成了一個很實用的App;當然政府的數據有些涉密,所以推動起來還得看這次兩會之後能否有指導文件出臺。一旦醫療衛生、交通安全、能源化工之類的大數據公佈其含金量將會比互聯網數據更大,不過處在“原礦”階段,還需要專業化團隊開發,比如浪潮集團與很多地方政府進行政務雲合作就是爲了開發政府大數據的巨大潛能。

  10. 數據要想發揮作用,數據資源只是前提,核心還是“雲計算”能力,最關鍵的是看應用的場景;也許這些數據放在這兒沒有用,但是在另外的地方卻是寶貝,因而應該會出現一個類似淘寶一樣的C2C數據交易平臺,我有需要的數據找有的人買;而你有的數據我正好需要;而數據之間的流通都是可以在移動端直接進行支付的,反正貨幣本質上也是數字。這樣的大數據平臺也許是一種全新的電商(線上交易)平臺,今年兩會孫丕恕代表有提到發展“數商”的重要理念。

  11. 大數據越來越成爲TMT行業發力的起點,如果創業者掌握沒有數據就沒有辦法照亮消費者,也沒有辦法去回溯生產端進行C2B(定製生產);在這點上,數據開始回顧到了市場營銷(Marketing)的本質,滿足用戶的需求,所以大數據最早爆發的領域是在精準營銷或者數字營銷上;直接服務於互聯網公司的廣告銷售;尤其是目前創業流量成本越來越高,廣告投放精準化需要有程序化平臺做專業投放;目前百度做人工智能就是主要以數字營銷爲發力點。

  12. 人工智能(AI)是一個與“移動互聯網”、“互聯網+”相媲美的大風口,但是人工智能必須要有大數據作爲訓練素材,機器學習、深度學習需要有大數據提升其機器人的學習能力。比如如果沒有消費場景的大數據,就沒有辦法做出商業智能;如果沒有醫療方面的大數據,就做不出智慧醫生。鑑於目前的大數據產業本身還沒有火起來,阿星認爲AI近幾年不可能迅速引爆,處於早期階段。但是人工智能概念的熱炒、資本大量涌入,爲大數據交易平臺的出現以及數據購買帶來錢景相當可觀的增量,反而促進了大數據產業開始受重視。

  13. 大數據把人都“標籤化”了,以前互聯網公司數據對立的都是ID(賬戶)數據,但是很難接近真人的數據,如今最能真實反映人的數據還是阿里和騰訊,讓以前無數多、散、匿、雜的數據越來越集中,越來越接近真人;而用戶也可以跳出物理範疇去延伸線上的世界,人與人之間的信任成本降低,陌生人之間的線上交易形成一個相對良好的契約基礎,這就是大數據所給予我們的第一波紅利。

  14. 可以預料,國內的大數據產業將與歐美完全不同,國外講究個人隱私,有嚴格的反隱私法的規定;並且東亞文化圈對上網“隱私”容忍度很高,相關法律機制也不健全,也給了一些大數據公司和互聯網用數據牟利帶來了“空間”,這有點像互聯網行業早期發展與國內知識產權相對寬鬆氛圍相關,整個行業抄去抄來,網民無版權意識用免費內容用慣了。但如果在互聯網行業已經成熟的今天,還在吃法律不健全的紅利顯然比較low了。

  15. 大數據是把雙刃劍,公民的數據信息必須得依法監管,如果一旦出現行業性數據安全泄密事件,將會相關新的新行業將陷入危機之中;如智能家居數據泄密將會造成人身財產安全隱患;比如在3月10日曝出一起某互聯網公司員工人盜取50億條公民數據的信息;這是DT崛起前最大的絆腳石;也從側面證明了大數據產業所處的原始混亂狀態。

發佈了117 篇原創文章 · 獲贊 83 · 訪問量 37萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章