看完《塊數據》後的一點思考

數據時代已經到來,大有一種得數據者得天下趨勢,更有觀點認爲,未來數據將成爲公司的固定資產的一部分。我覺得這種觀點是合理的,數據跟能源一樣也是資源,未來整個商業社會將被數據驅動。

首先,總結一下,我理解的數據價值實現的一般步驟:

數據跟其他資源一樣,因爲被人類開採才有價值。未來數據量之大將打破現有人們對數據量的認知,要能在數據海洋中開採到有用的數據,大數據技術將是每個數據公司的必須,所以這方面的工作有理由會火。目前,多數擁有大數據的公司好像都沒有大數據處理能力。

當我們開採到有用的數據之後,一般會將這些數據放在一個叫數據倉庫(Data Warehouse)的地方,這個數據倉庫和普通OLTP(On-Line Transaction Processing)數據庫有所不同,數據倉庫不需要很強的事務性,強調聯機分析能力。

在創建數據倉庫之後,我們需要對數據倉庫中的數據進行OLAP(Online Analytical Processing)和數據挖掘(Data Mining)。因此數據分析方法和數據挖掘算法就顯得尤爲重要,這是數據最終實現價值的最核心環節。在追求實時性和可靠性的商業需求下這方面也會是一個難點。這個領域也是大有可爲的,需要仔細琢磨。

然後,總結一下我理解的塊數據:

塊數據由條數據組成,條數據是分佈在各個行業各個領域的業務數據,比如公安部門人口數據、淘寶客戶消費數據以及銀行業務數據等等都是條數據。這些數據都只是時空中單一維度上的數據,都不能單獨反映一個完整時空狀態。從常識我們都可以知道,銀行判斷目標貸款客戶如果單從銀行業務數據判斷是遠遠不夠的,這就強調在塊數據中分析客戶的重要性。

多個條數據需要互聯互通,才能交織成塊數據,才能發揮數據的真正魅力。這個過程實現面臨層層阻礙。比如,如何讓社會不同組織之間都願意交出自己的數據(畢竟這些數據都是企業辛辛苦苦收集的,總不能白送吧)?如果某個組織願意交出自己的數據,那麼其他組織就會完全信任?在數據交換的過程中哪些數據是敏感數據,交換會不會導致數據泄露危機?

這些問題需要政府與企業共同努力。政府從上層構築好相關法律法規,企業界則要在技術上讓數據交換更加安全暢通。

在單個企業不可能擁有完整的塊數據情況下,條數據要上升爲塊數據的核心可以理解爲數據資產的交易。數據如何衡量價值,怎樣才能像商品一樣進行交易,也是一個可以思考的方向。

發佈了47 篇原創文章 · 獲贊 4 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章