UBER、RBER和MTBF的概念

轉載自 http://www.ssdfans.com

SSD有幾個關鍵指標來衡量其可靠性:UBER、RBER和MTBF。

UBER: Uncorrectable Bit Error Rate,不可修復的錯誤比特率;

RBER: Raw Bit Error Rate, 原始比特錯誤率;

MTBF: Mean Time Between Failure, 平均故障間隔時間。

1. 數據可靠性

我們接着看一下上面的S3710 SSD手冊中Reliability(可靠性)項的截圖:

image

UBER:Uncorrectable Bit Error Rate,不可修復的錯誤比特率,一種數據損壞率衡量標準,等於在應用了任意特定的錯誤糾正機制後依然產生的每比特讀取的數據錯誤數量佔總讀取數量比(概率)。

爲什麼SSD要定義UBER?任何一項存儲設備產品包括HDD,用戶最關心的是數據保存後的讀取正確性。試想數據丟失和損壞對客戶產生的後果是怎麼樣的?尤其是企業級用戶數據。那如何讓用戶相信存儲設備系統是可靠的呢?UBER指標,描述的是出現數據錯誤的概率,給用戶以直觀的概率數據描述錯誤數據的可能性,當然越低越好。

爲什麼會產生錯誤數據,SSD的存儲介質是閃存,閃存有天然的數據比特翻轉率。主要有以下幾種原因導致:

l 擦寫磨損(P/E Cycle)

l 讀取干擾(Read Disturb)

l 編程干擾(Program Disturb)

l 數據保持發生錯誤(Data Retention)

雖然SSD主控和固件設計會用糾錯碼(ECC)的方式(可能還包括其它方式,如RAID),但閃存在某種條件下依然有糾不回來的可能,所以需要有UBER讓用戶知道數據誤碼糾不回來的概率參考數據。

閃存原始的比特翻轉加上BCH碼(一種ECC糾錯算法)ECC 校驗保護後,可以計算轉換到UBER。影響到UBER最核心的是閃存原始的比特錯誤率,也叫RBER(Raw Bit Error Rate)。圖1-23從RBER、ECC編碼長度(Code Length)和保護強度(Strength)換算到UBER,從中得出結論:

相同的ECC編碼長度,隨着保護強度的增長,UBER在降低,呈大幅倍數降低。

image

圖1-1 UBER和糾錯強度的關係

相同的ECC編碼長度和保護強度,RBER越低,UBER也在降低,呈指數降低。

image

圖1-2 UBER和RBER的關係

RBER反映的是閃存的質量。所有閃存出廠時都有一個RBER指標,企業級閃存和消費級閃存的RBER顯然是不同的,價格當然也有所不同。RBER指標也不是固定不變,如圖1-25閃存的錯誤率會隨着使用壽命(PE cycle)增加而增加。爲了挑戰極限,必須準備好處理每100個bit就有1個壞的情況。

image

圖1-3 RBER 和PE的關係

RBER還跟閃存內部結構也有關係。兩個相鄰閃存塊的RBER有可能完全不同,圖1-26是單個閃存塊裏面不同閃存頁的RBER分佈圖。看得出來,Upper Page的RBER比Lower Page要高兩個數量級。

image

圖1-4 Lower&Upper page RBER

最後回到UBER指標作爲結尾,數據的UBER指標的要求對於企業級和消費級SSD各有不同,通常商用企業級和消費級SSD的UBER指標又是多少呢?如表1-9:

表1-9 企業級和消費級SSD UBER值

UBER

企業級(Enterprise)

10-17甚至10-18

消費級(Client)

10-15


2. MTBF

MTBF,即平均故障間隔時間,英文全稱是“Mean Time Between Failure”。是衡量一個產品(尤其是電器產品)的可靠性指標。單位爲“小時”。它反映了產品的時間質量,是體現產品在規定時間內保持功能的一種能力。具體來說,是指相鄰兩次故障之間的平均工作時間,也稱爲平均故障間隔 [1] 。概括地說,產品故障少的就是可靠性高,產品的故障總數與壽命單位總數之比叫“故障率”(Failure rate)。它僅適用於可維修產品。同時也規定產品在總的使用階段累計工作時間與故障次數的比值爲MTBF。磁盤陣列產品一般MTBF不能低於50000小時。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章