原创 大數據數據分析架構探究(二)

上一篇提到機器與機器之間交流,這裏解釋一下意思,其實說的是機器與機器間像人一樣交流,但交流的密度更甚於人與人之間,甚至於遠遠超過人,因爲它突破了很多人的限制。首先最重要突破的限制是交流的頻率和交流的網絡,交流的頻率就是人與人交流一條消息的平

原创 大數據數據分析架構探究

從範式角度來講,維度建模是以2NF的方式來描述數據,實體關係建模是以3NF的方式進行數據描述,由於分佈式數據架構的興起,使得維度建模得到了技術支持。換句話講,現在數據增長的速度,對於現在的數據技術架構不再是技術瓶頸。對於數據的存儲運用完全用

原创 Data Vault的一點思考(三)

前段時間和一家互聯網創新企業的數據架構師聊天,說他們正準備開始用Data Vault的模型進行數據倉庫的建設,他們有一套維度建模的集市,但是維度建模的特點是更貼業務,但是對於數據的存儲不是很友好,對於數據友好,他們是想在維度集市之前,加一層

原创 Data Vault的一點思考(二)

現在的企業,只要是有點規模的,已經不僅僅是有ER這一套數據倉庫模型來做數據,如現在很多企業從原有的線下轉到線上,就不得不面臨DM這一套數據模型,或者是線下和線上都有,而且是相互促進的(個人認爲這是發展趨勢的必然),但是貌似來說現階段線上企業

原创 銀行大數據平臺數據倉庫建模淺見(二)

這一篇我們來分析一下銀行數據倉庫現狀,談到銀行數據倉庫的建設,現有的狀況下大部分都是以ER模型爲主,其中FS-LDM是最爲常用或者是與之相似的數據倉庫實例有很多。先說一個結論,FS-LDM是一段時間沉澱下來的產物。在開始有數據庫的時候,隨着

原创 銀行大數據平臺數據倉庫建模淺見(一)

在數據倉庫建模這個領域裏面,有兩個最基本的理論,ER(Entity-Relationship)和DM(Dimensional Modeling),看過無數對於這兩個理論優缺點的對比,也就形成了一邊是支持Inmon的ER派,一邊是支持Kimb