大數據的存儲

一、對於大數據的存儲

  • 單機時代-------------------- RAID
  • 分佈式時代 -----------------分佈式文件系統

二、大規模數據存儲的核心問題

  1. 數據容量問題
  2. 數據讀寫速度問題
  3. 數據可靠問題

三、RAID(Redundant Arrays of Independent Drives)

  1. RAID 0 :速度快,但不做數據備份。無數據冗餘的的存儲空間條帶化,數據在從內存緩衝區寫入磁盤時,根據磁盤數量將數據分爲N份,這些數據同時併發寫入N塊磁盤。
  2. RAID 1: 可靠性高。使用磁盤鏡像(Disk mirroing)技術,將一份數據同時寫入兩塊磁盤。
  3. RAID 10: 提高可靠性,改善性能。將N塊磁盤平均分成兩份,在每一份磁盤中採用RAID 0技術將數據同時存入兩份磁盤,相當於RAID 1。
  4. RAID 3:將數據併發寫入N-1塊磁盤,並在第N塊磁盤記錄效驗數據,導致第N塊磁盤比其他磁盤更容易損壞。
  5. RAID 5:將校驗數據螺旋式寫入所有磁盤
  6. RAID 6: 與RAID 5相似,但數據只寫入N-2塊磁盤,並將 校驗數據螺旋式的寫入在2塊磁盤中

四、如何存儲

  1. 升級計算機 -------------------垂直伸縮
  2. 升級CPU、內存、磁盤----水平伸縮
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章