我折騰這個的原因:
- 大數據量的存儲;
- 海量數據的分析
但是目前看來,存儲的問題上不大,但是mongdb那些特性對於我的#大數據#上沒有適配的地方
而另外一個重中之重就是數據統計和分析,這是我的需求核心,我需要對海量數據進行查詢統計,太多的group by之類的了
而mongodb似乎不能滿足我的要求(或者我不知道),我只是在各種mongodb的資料中只是看到了簡單的條件型select
我需要的是海量數據的真正分佈式計算型數據庫!例如我有1TB數據。可能同時同步存儲在4個數據節點上,當我要做某個統計分析的時候,我需要這個統計分析可以被轉化下去到這四個節點上然後再彙總。這樣的分佈式計算提升我單節點計算的性能!
PS,我對於那個Map/Reduce還是有點搞不清楚狀態!我再去查查資料!
查了一下資料,好像所謂的MapReduce可以滿足我的分佈式需求,可是Group之類的呢?
事務我是不需要的。但是MongoDB的查詢確實太麻煩了!