Redis、Memcache和MongoDB的區別

>>Memcached

Memcached的優點:
Memcached可以利用多核優勢,單實例吞吐量極高,可以達到幾十萬QPS(取決於key、value的字節大小以及服務器硬件性能,日常環境中QPS高峯大約在4-6w左右)。適用於最大程度扛量。
支持直接配置爲session handle。
Memcached的侷限性:
只支持簡單的key/value數據結構,不像Redis可以支持豐富的數據類型。
無法進行持久化,數據不能備份,只能用於緩存使用,且重啓後數據全部丟失。
無法進行數據同步,不能將MC中的數據遷移到其他MC實例中。
Memcached內存分配採用Slab Allocation機制管理內存,value大小分佈差異較大時會造成內存利用率降低,並引發低利用率時依然出現踢出等問題。需要用戶注重value設計。

>>Redis

Redis的優點:
支持多種數據結構,如 string(字符串)、 list(雙向鏈表)、dict(hash表)、set(集合)、zset(排序set)、hyperloglog(基數估算)
支持持久化操作,可以進行aof及rdb數據持久化到磁盤,從而進行數據備份或數據恢復等操作,較好的防止數據丟失的手段。
支持通過Replication進行數據複製,通過master-slave機制,可以實時進行數據的同步複製,支持多級複製和增量複製,master-slave機制是Redis進行HA的重要手段。
單線程請求,所有命令串行執行,併發情況下不需要考慮數據一致性問題。
支持pub/sub消息訂閱機制,可以用來進行消息訂閱與通知。
支持簡單的事務需求,但業界使用場景很少,並不成熟。

Redis的侷限性:
Redis只能使用單線程,性能受限於CPU性能,故單實例CPU最高才可能達到5-6wQPS每秒(取決於數據結構,數據大小以及服務器硬件性能,日常環境中QPS高峯大約在1-2w左右)。
支持簡單的事務需求,但業界使用場景很少,並不成熟,既是優點也是缺點。
Redis在string類型上會消耗較多內存,可以使用dict(hash表)壓縮存儲以降低內存耗用。

Mc和Redis都是Key-Value類型,不適合在不同數據集之間建立關係,也不適合進行查詢搜索。比如redis的keys pattern這種匹配操作,對redis的性能是災難。

>>mongoDB 

mongoDB 是一種文檔性的數據庫。先解釋一下文檔的數據庫,即可以存放xml、json、bson類型系那個的數據。

這些數據具備自述性(self-describing),呈現分層的樹狀數據結構。redis可以用hash存放簡單關係型數據。

mongoDB 存放json格式數據。

適合場景:事件記錄、內容管理或者博客平臺,比如評論系統。

1.mongodb持久化原理

mongodb與mysql不同,mysql的每一次更新操作都會直接寫入硬盤,但是mongo不會,做爲內存型數據庫,數據操作會先寫入內存,然後再會持久化到硬盤中去,那麼mongo是如何持久化的呢
mongodb在啓動時,專門初始化一個線程不斷循環(除非應用crash掉),用於在一定時間週期內來從defer隊列中獲取要持久化的數據並寫入到磁盤的journal(日誌)和mongofile(數據)處,當然因爲它不是在用戶添加記錄時就寫到磁盤上,所以按mongodb開發者說,它不會造成性能上的損耗,因爲看過代碼發現,當進行CUD操作時,記錄(Record類型)都被放入到defer隊列中以供延時批量(groupcommit)提交寫入,但相信其中時間週期參數是個要認真考量的參數,系統爲90毫秒,如果該值更低的話,可能會造成頻繁磁盤操作,過高又會造成系統宕機時數據丟失過。

2.什麼是NoSQL數據庫?NoSQL和RDBMS有什麼區別?在哪些情況下使用和不使用NoSQL數據庫?
NoSQL是非關係型數據庫,NoSQL = Not Only SQL。
關係型數據庫採用的結構化的數據,NoSQL採用的是鍵值對的方式存儲數據。
在處理非結構化/半結構化的大數據時;在水平方向上進行擴展時;隨時應對動態增加的數據項時可以優先考慮使用NoSQL數據庫。
在考慮數據庫的成熟度;支持;分析和商業智能;管理及專業性等問題時,應優先考慮關係型數據庫。

3.MySQL和MongoDB之間最基本的區別是什麼?
關係型數據庫與非關係型數據庫的區別,即數據存儲結構的不同。

4.MongoDB的特點是什麼?
(1)面向文檔(2)高性能(3)高可用(4)易擴展(5)豐富的查詢語言

5.MongoDB支持存儲過程嗎?如果支持的話,怎麼用?
MongoDB支持存儲過程,它是javascript寫的,保存在db.system.js表中。

6.如何理解MongoDB中的GridFS機制,MongoDB爲何使用GridFS來存儲文件?
GridFS是一種將大型文件存儲在MongoDB中的文件規範。使用GridFS可以將大文件分隔成多個小文檔存放,這樣我們能夠有效的保存大文檔,而且解決了BSON對象有限制的問題。

7.爲什麼MongoDB的數據文件很大?
MongoDB採用的預分配空間的方式來防止文件碎片。

8.當更新一個正在被遷移的塊(Chunk)上的文檔時會發生什麼?
更新操作會立即發生在舊的塊(Chunk)上,然後更改纔會在所有權轉移前複製到新的分片上。

9.MongoDB在A:{B,C}上建立索引,查詢A:{B,C}和A:{C,B}都會使用索引嗎?
不會,只會在A:{B,C}上使用索引。

10.如果一個分片(Shard)停止或很慢的時候,發起一個查詢會怎樣?
如果一個分片停止了,除非查詢設置了“Partial”選項,否則查詢會返回一個錯誤。如果一個分片響應很慢,MongoDB會等待它的響應。

 

從以下幾個維度,對redis、memcache、mongoDB 做了對比

1、性能

都比較高,性能對我們來說應該都不是瓶頸

總體來講,TPS方面redis和memcache差不多,要大於mongodb

2、操作的便利性

memcache數據結構單一

redis豐富一些,數據操作方面,redis更好一些,較少的網絡IO次數

mongodb支持豐富的數據表達,索引,最類似關係型數據庫,支持的查詢語言非常豐富

3、內存空間的大小和數據量的大小

redis在2.0版本後增加了自己的VM特性,突破物理內存的限制;可以對key value設置過期時間(類似memcache)

memcache可以修改最大可用內存,採用LRU算法

mongoDB適合大數據量的存儲,依賴操作系統VM做內存管理,吃內存也比較厲害,服務不要和別的服務在一起

4、可用性(單點問題)

對於單點問題,

redis,依賴客戶端來實現分佈式讀寫;主從複製時,每次從節點重新連接主節點都要依賴整個快照,無增量複製,因性能和效率問題,

所以單點問題比較複雜;不支持自動sharding,需要依賴程序設定一致hash 機制。

一種替代方案是,不用redis本身的複製機制,採用自己做主動複製(多份存儲),或者改成增量複製的方式(需要自己實現),一致性問題和性能的權衡

Memcache本身沒有數據冗餘機制,也沒必要;對於故障預防,採用依賴成熟的hash或者環狀的算法,解決單點故障引起的抖動問題。

mongoDB支持master-slave,replicaset(內部採用paxos選舉算法,自動故障恢復),auto sharding機制,對客戶端屏蔽了故障轉移和切分機制。

5、可靠性(持久化)

對於數據持久化和數據恢復,

redis支持(快照、AOF):依賴快照進行持久化,aof增強了可靠性的同時,對性能有所影響

memcache不支持,通常用在做緩存,提升性能;

MongoDB從1.8版本開始採用binlog方式支持持久化的可靠性

6、數據一致性(事務支持)

Memcache 在併發場景下,用cas保證一致性

redis事務支持比較弱,只能保證事務中的每個操作連續執行

mongoDB不支持事務

7、數據分析

mongoDB內置了數據分析的功能(mapreduce),其他不支持

8、應用場景

redis:數據量較小的更性能操作和運算上

memcache:用於在動態系統中減少數據庫負載,提升性能;做緩存,提高性能(適合讀多寫少,對於數據量比較大,可以採用sharding)

MongoDB:主要解決海量數據的訪問效率問題

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章