一、對於大數據的存儲
- 單機時代-------------------- RAID
- 分佈式時代 -----------------分佈式文件系統
二、大規模數據存儲的核心問題
- 數據容量問題
- 數據讀寫速度問題
- 數據可靠問題
三、RAID(Redundant Arrays of Independent Drives)
- RAID 0 :速度快,但不做數據備份。無數據冗餘的的存儲空間條帶化,數據在從內存緩衝區寫入磁盤時,根據磁盤數量將數據分爲N份,這些數據同時併發寫入N塊磁盤。
- RAID 1: 可靠性高。使用磁盤鏡像(Disk mirroing)技術,將一份數據同時寫入兩塊磁盤。
- RAID 10: 提高可靠性,改善性能。將N塊磁盤平均分成兩份,在每一份磁盤中採用RAID 0技術將數據同時存入兩份磁盤,相當於RAID 1。
- RAID 3:將數據併發寫入N-1塊磁盤,並在第N塊磁盤記錄效驗數據,導致第N塊磁盤比其他磁盤更容易損壞。
- RAID 5:將校驗數據螺旋式寫入所有磁盤
- RAID 6: 與RAID 5相似,但數據只寫入N-2塊磁盤,並將 校驗數據螺旋式的寫入在2塊磁盤中
四、如何存儲
- 升級計算機 -------------------垂直伸縮
- 升級CPU、內存、磁盤----水平伸縮