IOPS和帶寬對存儲性能指標的影響

原文出處:http://975220.blog.51cto.com/965220/531449/


說起存儲產品的評價,性能永遠是第一重要的問題。關於性能的各種指標實在五花八門:帶寬(Bandwidth)、IOPS、順序(Sequential)讀寫、隨機(Random)讀寫、持續吞吐(Sustained Throughput)、突發處理能力(Burst I/O)等等看似甚爲專業的名詞充斥着解決方案和技術分析報告。存儲產品的性能似乎被量化得格外清晰,作爲用戶,只需要簡單的比較兩個數字,就可以清楚的得出孰優孰劣的結論。然而,事實果真如此嗎?

就讓我們走進那些五花八門的指數背後,去看看性能的真實面目。
 

1、帶寬與I/O
    這是兩個衡量存儲設備性能最基本的概念,明確的區分兩者也是對存儲產品性能瞭解的第一步。如果我們把存儲設備比做一間會議室,被存取的數據就是前來參加會議或從會議中離開的人,那麼帶寬性能就是指這間會議室大門的寬度,大門越寬,可以同時進出的人也就越多,而I/O性能是指房門開合的頻繁程度,迎來一批前來參加會議的人,就需要打開一次大門,送走一批人也是一樣,哪怕這“一批人”其實只是一個人。由此可見,當我們考察會議室的門設計得是否合理時,必須結合會議本身的性質。
  
    對紀律嚴明的會議來說,與會者輕易不會凌亂的進出會場,人們在會議開始時統一進入,結束時再統一離開。對這種情況,門的寬度就十分重要,而是否易於開合則顯得不那麼關鍵,反正這扇門在整個會議中只需要開合兩次而已。相反的,對於聯歡性質的聚會而言,門設計得太寬除了顯得氣派之外,並沒有什麼實際的意義,但是門開合的頻率卻很重要,因爲會有客人頻繁的進進出出。
  
    對應到存儲設備上,道理也是一樣。大文件持續傳輸型的應用需要的是充分的帶寬性能,而小文件隨機讀寫的應用則要求足夠的I/O能力。那麼多大的文件算“大文件”呢?一般而言,超過1MB大小的文件就可以算做“大文件”了。如果您的應用系統處理的資料中,最小的文件也有4~5MB甚至幾十MB,就需要重點考察存儲系統的帶寬性能了。如果您的應用是數據庫形式,或是電子郵件系統,系統中有大量KB級大小的文件,那麼就可以忽略掉產品介紹中xxx MB/s的字樣,重點關心xxx IOPS就可以了。
  
    2、影響性能的因素
  
    當然,僅看產品彩頁中的簡單數字還是遠遠不夠的。存儲設備的標稱指數只是其最最理想情況下的表現,而實際應用中,存儲設備表現出的處理能力往往與其標稱指數相去甚遠。爲了反映更多的細節,會議室的比喻不足以說明問題。所以我們前面的例子再改進一下,把存儲設備看作一棟有很多房間的大廈。人們從門口進入大廈,先來到大堂,經過走廊,最後到達房間。人們進大廈的方式也分爲兩種:一種是所有人按房間號碼順序排好隊,一起進入大廈,我們稱之爲“順序進入”;另一種是他們無規律的自由進入,我們稱爲“隨即進入”。
  
    顯而易見,“順序進入”的效率要大大高於“隨即進入”。這就說明,一般情況下,順序讀寫的性能要遠高於隨即讀寫的性能。還有一個結論也不難得出,一個寬敞的大堂更有利於偶然性較大的“隨機進入”,而對“順序進入”的人羣而言,經過大堂基本屬於浪費時間。存儲設備中的“大堂”就是高速緩存。
也就是說,大容量高速緩存可以提高隨機讀寫性能,而對順序讀寫的性能改進則不明顯。
  
    還記得前面討論的帶寬和I/O的差別嗎?帶寬考察的是單位時間進入大廈的人數,而I/O關心的是單位時間進出大廈的批次。從次可見,如果走廊沒有任何變化,那麼大堂只要不是太小,就不會影響帶寬性能。相對的,對I/O性能而言,大堂顯然是越大越好。總之,影響帶寬的因素主要是前端控制器(大門)和後端磁盤通道(走廊)的帶寬;而影響I/O的因素主要是控制器(大門)處理能力和高速緩存(大堂)容量。
  
    當然,前面的討論都基於一個假設前提:磁盤(房間)足夠多。如若只配置寥寥幾個磁盤,它們就會成爲整個系統的性能瓶頸。任憑其他配置如何奢華,也於事無補。那麼,“足夠多”又是多少呢?對光纖通道存儲設備來說,每個光纖通道上的磁盤數量達到50~60個的時候性能達到最佳。所以一般中高端存儲設備都把每通道50~60個磁盤設計爲擴展極限,而不是光纖通道技術規定的126個。



 
圖1. 磁盤數量影響光纖環路性能

這樣設計存儲產品,可以讓系統的性能隨着容量的增加而增長。但是同時,用戶必須明白,在容量沒有配置到最大值的時候,性能就無法達到廠商所宣稱的指標。一些廠商還聲明其產品的性能可以隨着容量的增長而線性增長,按這樣講,當你的存儲設備只配置了最大容量的一半時,你得到的性能也只有系統最佳性能的一半。
  
    3、性能曲線
  
    這裏所說的“最佳性能”就是廠商所宣稱的指數嗎?很遺憾,答案是不一定,一般都不是,而且可能會相差很遠!我已經聽到有人在叫“天啊!那廠商公佈的數字到底有什麼意義啊。”別急,看到下面兩個圖示就清楚了。



圖2. IOPS性能曲線示例

 



圖3. 帶寬性能示例

這兩個圖示是典型的存儲設備性能實測曲線,所有曲線來自同一個存儲設備的同一個配置。不同產品在縱向指標上表現各異,但曲線的形狀都大體相同。從圖上可以看出,用戶環境中存儲設備的性能表現嚴重依賴數據塊的大小。以順序讀取操作爲例,如果應用產生的數據塊大小在8KB左右,那麼帶寬性能和I/O性能最多也只能達到峯值性能的一半左右。如果希望得到更好的I/O性能,就需要儘量將數據塊調整得更小。但不幸的是,如果希望帶寬性能更好,就需要想辦法把數據塊設置得更大。看來,帶寬與I/O性能是魚與熊掌,難以兼得啦。

不過沒關係,如我們前面提到的,幸好大多數用戶其實只需要其中一種性能。要麼是大文件類型的應用,需要帶寬性能;抑或是小文件類型應用,需要I/O能力。需要帶寬的用戶相對容易得到滿足。從圖3可以看出,只要數據塊大於128KB,順序讀的性能就基本可以達到系統飽和值。對順序寫,飽和數據塊略大一些,但256KB也不算難以達到的尺寸。

得到最佳的I/O性能似乎就沒那麼容易了。從圖2的曲線來看,I/O性能並沒有一個飽和狀態,這就要求數據塊無窮盡的儘量小。然而所有應用都不可能支持無窮小的數據塊。實際上,大多數的數據庫應用產生的數據塊都在2KB或4KB左右。在這個尺度上,應用得到的性能距離最高性能還有至少20~30%的空間呢。
  
    4、持續和突發
  
    回到我們那個關於大廈的例子。如果大廈臨時發生緊急情況,比如火災,人們爭先恐後的蜂擁在門口,景象一定是一片混亂。在實際應用中,存儲系統也可能遭遇類似的情況,一時間大量數據同時被訪問,造成系統嚴重堵塞。這就像存儲系統內的交通高峯,往往需要類似交通管制的手段才能提高系統效率。一些廠商會宣稱他們的產品在這種情況下的“交通管制”能力有多強,以致可以從容應付大規模的突發訪問。諸如“全交換結構”、“直接矩陣結構”等技術均屬此類。究其本質,這些“交通管制”都是在大堂(高速緩存)的設計上做文章,將原本一個公共大堂的結構變成若干獨立大堂的結構。以此來避免火災發生時,所有人都擁擠到一個大堂裏。
  
    這樣設計的確可在訪問突然爆發時緩解系統壓力,但是需要注意,這樣設計的大廈內部一定佈滿了各種指示牌和路標,對任何一個進入大廈的人而言,進入房間的過程都將變得更復雜。其結果就是,非突發狀態下,系統的持續讀寫能力往往還不如同等計算能力的簡單結構存儲。
  
    5、其他影響
  
    除了前面所談到諸多方面外,還有很多因素都會影響到存儲設備在實際運行中的性能。例如RAID級別的設置、磁盤類型甚至型號批次的匹配、緩存的鏡像、SCSI指令隊列深度的設置,這些方面都與性能結果直接相關。而且,爲了能夠得到最好的性能指數,幾乎所有的廠商在測試自己產品性能的時候都會採用無冗餘的RAID0、選用15k rpm的高速磁盤、將寫緩存鏡像保護關閉或者乾脆關閉寫緩存、將指令隊列深度設置爲最大。如此配置方式相信不是每個用戶都可以接受的。
  
    另外,所有存儲設備在運行快照或遠程鏡像等附加功能之後,性能都會明顯下降,有些情況甚至會下降60%之多。如果用戶的應用恰巧需要這些附加功能,就需要在選用存儲設備之前認真的實地測量一下真實性能。免得滿懷希望的買回家,使用起來卻失望至極。
  
    結論和建議
  
    想要知道梨子的滋味,最好的辦法就是親自嘗一嘗。對存儲設備,這個道理尤其重要。只有在用戶需要的配置方式下,在實際的應用系統中,實實在在的運行之後,用戶才能真正清楚的感知存儲設備的真實性能表現。紙上談兵只怕會使用戶在各種數據中迷失方向,難以做出正確結論。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章