數據倉庫一書的感悟與批判-大型數據倉庫

大型數倉的問題

存儲費用

隨着數據量的增大,存儲費用越來越高,並且要注意到存儲費用並不只是存儲硬件的費用,還包括相應的處理硬件和軟件的費用

利用率

數據越多的時候數據利用率越低

多級存儲

  • 人工
    有人來對多種存儲介質中數據進行同步
  • HSM
    系統全量同步
  • CMSM
  • 行級同步,就是根據當前請求自動去加載數據.就有點像操作系統的分頁算法,站在調用方看似乎所有的數據都ready了等待讀取,其他是真正讀取的時候才從下一級的存儲讀到上一次存儲.

性能優化

根據實際情況來平衡多方面指標
在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章