固態硬盤壽命測試一年半 壽命指數超乎想象 連寫2500TB終於全掛

固態硬盤可靠性測試:寫入22TB數據之後……

 

SSD固態硬盤相比傳統HDD機械硬盤的優點是性能強、體積小、無噪音,但是特殊的工作原理也讓它的使用次數有限,而且這個次數還會隨着製程工藝的升級而降低,編程/擦寫循環次數從之前的5000+降低到3000次甚至1000次。

 

SSD使用壽命是個老生常談的話題了,廠商一次次強調隨着SSD容量的增加和主控技術的進步,SSD有限的寫入次數對使用壽命來說並不是嚴重問題了,不過想打消消費者的疑惑還沒這麼容易。

 

此前Hardware.info網站以TLC閃存的三星840 SSD爲例做了一次長期的SSD使用壽命測試,結果顯示其可用寫入次數是大大超過官方標準的,TLC閃存的可靠性也不是問題。

 

現在又有媒體來接力了,TechReport也做了SSD使用壽命的長期測試,不過他們採集的樣本更多,使用了6款SSD,包括三星840 Pro、三星840、金士頓HyperX 3K(這個使用了兩款,一個進行可壓縮數據測試,一個進行不可壓縮數據測試)、Intel 335及海盜船Neutron GTX,容量都是256GB或者240GB的。


他們使用了Anvil's Storage Utilities軟件進行大規模數據寫入,現在過去了兩週多了,寫入的數據已經達到了22TB,是時候檢驗一下這六款SSD的情況了。


第一個節點選擇22TB是因爲這個寫入量是Intel公佈的335 SSD正常使用壽命,官方稱它可以在每天20GB的寫入量情況下使用三年。此外,金士頓的HyperX 3K SSD官方公佈的寫入量是192TB,其他三款SSD就沒有官方數據公佈了。 


首先來看各個SSD的平均寫入速度,但是上述數據並不具備可比性,因爲爲了加快測試進度,這6個SSD是安裝到了兩套平臺上同步進行的,有的使用了SATA 6Gbps接口,有的使用了SATA 3Gbps接口。上面的平均寫入速度只能用於評估各SSD寫入22TB所用時間。

 

相比速度絕對值,他們更關注的是寫入22TB數據之後的SSD性能的前後變化。這時候的測試結果是恢復到之前測試平臺和系統上進行的,因此前後結果可以對比。

 

寫入22TB數據後的隨機、連續性能變化:


連續讀取速度變化

                                                                         
                                                                                                                                            連續寫入速度變化

                                                                         
                                                                                                                                              隨機讀取速度變化

                                                                           
                                                                                                                                              隨機寫入速度變化

 

大部分測試中SSD前後性能變化都在1-2%左右,考慮到誤差因素,可以說他們在寫入22TB數據之後性能並沒有什麼變化。

 

讓人喫驚的是金士頓HyperX 3K SSD的隨機讀取性能,不論是可壓縮數據還是不可壓縮數據,性能都提升了30%以上,Intel的335 SSD也小幅提高了8%,這二者使用的都是SF主控。

 

此外,SMART信息也會不斷追蹤SSD的壞塊、寫入數據量等信息,不過目前爲止還沒看到有壞塊出現,這些SSD依然很健康。

 

測試中有2個型號的SSD都使用了SF主控,而且隨機讀取速度在寫入22TB數據之後反而有46%的提升。另外,數據壓縮測試中,不可壓縮數據寫入了22.8TB,而可壓縮的那個只寫入了15.5TB數據,節省了32%,還是有用處的。

 

再看下SSD的寫入放大。兩款HyperX 3K SSD的本機寫入量都是21.6TB,實際寫入數據一個是22.8TB,可壓縮的則是15.5TB,寫入放大率分別是1.05和0.72(注:這種持續寫入數據的情況下寫入放大率不會很大,接近1是很正常的)。

 

Intel的335 SSD的NAND寫入量是22.9TB,主機寫入量是21.6TB,寫入放大跟金士頓HyeprX 3K差不多。至於其他SSD,因爲追蹤不到NAND寫入量,所以無法計算寫入放大。

 

以上就是寫入22TB數據之後的基本情況,他們的下一個目標是100TB,估計還要等很長時間了


 

固態硬盤耐用性試驗:200TB重壓下的壞塊

 

TechReport從今年八月底開始了一項固態硬盤耐用性試驗,找來多款240/256GB的產品對它們持續進行寫入,看看什麼時候會掛掉,性能又會如何變化。

 

半個月後他們寫入了22TB數據,相當於連續三年每天20GB,所有硬盤都應付得很好。

 

現在,數據寫入量已經達到200TB,相當於連續五年每天100GB,終於有扛不住的了。 



其實在寫入量超過100TB的時候,三星840就第一個出現了問題,S.M.A.R.T.屬性中顯示有11個重新分配的扇區,換句話說就是有了壞塊(bad block)。三星840採用的是3bit TLC閃存,寫入耐久性本來就比其它用2bit MLC的要差一些,這並不意外。

 

不過儘管如此,這塊硬盤的性能、容量都沒有絲毫變化,一切表現正常。

 

寫入了200TB之後,三星840重新分配的扇區已有370個,金士頓HyperX 3K也有了四個壞塊。值得一提的是,本次測試用了兩塊Hyper 3K,其中一塊寫入可壓縮數據(46%),另一塊則和其它一樣用不可壓縮數據,出問題的是後者。

 

這顯然是SandForce主控的緣故,經過它壓縮的前者實際只向閃存寫入了143GB。

 

金士頓HyperX 3K的區塊大小爲4MB,所以損失的總容量爲16MB。三星840的區塊大小不詳,三星也一直沒有迴應詢問,從測試看應該是1.5MB,那麼損失容量就達到了555MB。

 

不過由於損壞並替換的區塊都位於冗餘容量內,兩塊硬盤的實際可用量都沒有變化,Windows下仍然分別是HyperX 3K 224GB、840 234GB。

 

三星SSD Magician工具顯示840的健康狀況依然是“良好”(good),但是用來獲取S.M.A.R.T.屬性數據的Hard Disk Sentinel卻並不樂觀:

 

在它看來,寫入100TB數據後三星840的健康度就只剩下了66%,840 Pro也不過78%,另外Intel 335也損失了12%。

 

200TB寫入後,三星840 19%的健康度看上去岌岌可危,840 Pro 51%也不怎麼樣,不過金士頓HyperX 3K(不可壓縮數據)仍然有98%,寫入可壓縮數據的海盜船Neutron GTX都還是100%。

 

此外,海盜船的工具沒有健康度顯示,金士頓的不兼容測試平臺。


儘管有損壞的區塊,以及看起來很嚇人的健康度指示,但不得不說這些固態硬盤都很好地經受了考驗,迄今仍可正常使用,而且不要忘了,連續五年每天寫入100GB在實際應用中幾乎是不可能的。

那麼,性能上都有了什麼變化呢?


持續讀取


持續寫入


隨機讀取


隨機寫入

100TB、200TB寫入後都對六塊硬盤的持續、隨機讀寫速度進行了測試,結果發現都和最初水準相差無幾,200TB後也沒有超過2%。

 

值得一提的是,金士頓HyperX 3K的性能在寫入22TB後反而大大高於最初,100TB之後仍然更高,200TB後才降下來。

 

此外,測試人員還使用了Anvil的耐久性測試工具,安全擦除全盤後寫入一系列隨機大小的文件,直到預定的限制,然後在下次常規寫入前刪除它們,下邊就是每輪寫入的平均速度:


注意:六塊硬盤連接在兩套相同的系統上,但因爲接口數量限制,兩塊HyperX使用的是SATA 3Gbps,其它都是SATA 6Gbps。這裏我們對彼此性能差異沒興趣,只看各自性能隨時間的變化。

 

金士頓、Intel都使用了SandForce的主控,峯值都出現在22TB、100TB寫入後的安全擦除,這使得主控暫時恢復了活力。

 

三星840 Pro每次擦除後也會復活,但是性能飄忽不定、波動太大,不過從一開始就這樣,可能和垃圾回收、內部管理機制有關,而不是閃存的問題。

 

三星840出現了最明顯的性能滑坡,從超過100MB/s跌到了大約85MB/s,但這和壞塊沒什麼關係。

 

海盜船的Neutron GTX反倒是越來越快了。

 

試驗還在繼續,等着看寫入300TB之後又會如何吧。


固態硬盤連續寫入300TB:Intel 335也“壞了”


TechReport堅持進行的固態硬盤耐用性馬拉松試驗再次達到關鍵節點,數據寫入量已經走過300TB,現在各位參賽選手的情況又是如何呢?

 

背景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊


最先出現問題的三星840 250GB情況正在持續惡化。100TB的寫入後就出現了11個重新分配扇區,200TB後增至370個,300TB後則達到了833個。三星依然拒絕透露每個扇區的具體尺寸,如果按照1.5MB的猜測計算那就是1.2GB。

 

看上去不少,但幸運的是,因爲冗餘容量更多,用戶實際可用的仍未發生變化。

 

840是唯一一個使用TLC閃存顆粒的,其耐久性存在天然缺陷,因此這一切都並不意外。

 

寫入不可壓縮數據的金士頓HyperX 240GB之前出現了4個重新分配扇區,但此後表現穩健,沒有進一步增多。另一款寫入的是可壓縮數據,感謝SandForce主控的數據壓縮,實際寫入量僅有215TB。

 

除此之外,Intel SSD 335 240GB也加入了這一行列,出現了1個重新分配扇區。


健康度方面,S.M.A.R.T.屬性顯示840只有恐怖的1%,可謂岌岌可危,840 Pro 256GB也掉到了26%,不過三星自己的SSD Magician工具依然報告它們倆狀態“良好”(Good)。

 

Intel SSD Toolbox也報告其SSD 335狀態良好,儘管健康度指數已經跌至58%。

 

金士頓HyperX不可壓縮版仍舊維持在98%,可壓縮版和海盜船的Neutron GTX 240GB則堅挺在100%。

 

這裏其實反映了一個很現實的問題,那就是固態硬盤缺乏統一的磨損、健康狀態評判標準,每家都有自己的一套算法,有的甚至根本不理會S.M.A.R.T屬性指標,而第三方工具也只是在估算。


那麼,此時的性能又有了什麼變化呢?


4MB持續讀取


4MB持續寫入


4KB持續讀取

                                                    
                                                                                                                                              4KB持續寫入

 

除了金士頓HyperX 4KB隨機讀取中的一些異常波動,所有硬盤都維持在了最初的水準上,即便是情況日益嚴重的840也變化非常小。


這是每一次寫入循環(大約190GB)完成後記錄的寫入速度。200TB節點後,840 Pro又爆發了一下,隨後迴歸往常的飄忽不定。其它的都幾乎紋絲不動,840也是如此,只有Neutron GTX又在逆天地緩慢增加了,雖然幅度極小。

 

不停地寫入300TB數據,相信這是絕大多數普通用戶都不會碰到的,而如此殘酷考驗下固態硬盤們都堅持了下來,雖然有些扇區出現了損壞但都能及時自我修復,且絲毫不影響性能。這確實可以讓我們對固態硬盤的長期可靠性大爲放心了,尤其是TLC也沒有很多人想象的那麼糟糕。

 

測試還在繼續,我們等下一個節點……



固態硬盤連寫500TB:個個都是“豬堅強”


TechReport自去年八月開始的固態硬盤耐用性持久測試又跨過了一個關鍵點,持續寫入的數量已經突破500TB。有沒有誰被擊垮呢?

前景回顧:

 

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

參測成員:

- 海盜船Neutron GTX 240GB

- Intel SSD 335 240GB

- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮數據)

- 三星840 250GB

- 三星840 Pro 256GB


重分配扇區數量趨勢:


三星840是惟一一個採用TLC閃存顆粒的,其天然屬性決定了耐用性相對較差,也毫不意外地第一個出現了壞塊,100TB之後就有了11個重新分配的扇區,200TB之後增至370個,300TB之後達到了833個,如今則是1722個。

 

其它硬盤仍然只有寥寥幾個壞區,影響微乎其微,Neutron GTX、Hyper 3K(可壓縮版)則是唯一兩個至今完好無損的

 

三星依然不肯披露840的扇區規格,但基本可以確定爲1.5MB,那就是已經損失了大約2.5GB,但是因爲冗餘容量足夠,這對實際可用容量仍無影響。

 

840雖然明顯是最糟的,但不能因此就說TLC閃存不靠譜。算一下你就知道,500TB相當於在十年的時間裏每天寫入140GB,平常誰能做到這一點?

 

在這樣的重壓之下,840的確有些喫力,好幾次都沒能通過重建測試中的HASH校驗。雖然最終還是過去了,但是查看SMART屬性可以看到大量的不可恢復錯誤,實際應用中這很容易導致數據丟失,甚至系統崩潰。

 

但奇怪的是,三星自家工具Magician依然認爲840很健康,它能訪問SMART數據但主界面上依然說健康程度良好。840 Pro終於也有了兩個重新分配扇區,沒有不可恢復的錯誤,健康度也是良好。

 

第三方工具的結果就差異太大了,HD Sentinel就把840、840 Pro的健康度都列爲了1%,照它看來這倆硬盤都廢了。

 

接下來看看各塊固態硬盤的性能變化趨勢:


4MB持續讀取


4MB持續寫入


4KB隨機讀取


4KB隨機寫入

 

雖然有一些波動,但是總體而言,經過了這小半年的折磨,大家的性能基本都還維持了原樣,這下子大家可以徹底放心了。

 

不過,840 Pro的持續寫入最近開始有所下滑,從大幅領先變成了接近Neutron GTX,後續要重點觀察。

 

此外,Intel、金士頓的隨機讀取速度初期反常地偏高,至今原因不明,可能和它們使用的SandForce主控有關。

 

再看平均寫入速度:


840 Pro從一開始就飄忽不定,至今仍是這個樣子,不過似乎有衰退的趨勢,最高、最低值都不如早前了。

 

總的來說,大家的表現都很穩健,沒有出現重大變故,Neutron甚至還在逆天地緩慢增長中。

 

那些突起可以忽略,每次到達關鍵點後對所有硬盤進行安全擦除的緣故。

 

最後是個小插曲:測試進行到300-400TB之間的時候,三星840/840 Pro、金士頓HyperX 3K(可壓縮版)突然系統崩潰,沒有任何預先警告,當時系統也一切正常。系統日誌中出現了系統盤突然斷開的條目,可能就是罪魁禍首。

 

測試使用的系統盤是海盜船Force GT 60GB,壽命才兩年,數據寫入量不過幾個TB,按理說不應該有什麼問題,SMART屬性裏也沒有錯誤,不過它的主控是SandForce,鬧個脾氣也很正常。

 

爲了避免類似問題重現,系統盤換成了Intel SSD 510,此後也確實一切順利。

 

測試仍在繼續,下一站:600TB。




固態硬盤連寫600TB:這都弄不死你們

TechReport發起的固態硬盤耐久性測試已經進行了整整半年的時間,數據寫入量也突破了600TB,那麼參賽選手們的最新狀況如何?

 

照例前景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

固態硬盤連寫500TB:個個都是“豬堅強”

參測成員:

- 海盜船Neutron GTX 240GB

- Intel SSD 335 240GB

- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮數據)

- 三星840 250GB

- 三星840 Pro 256GB

首先是個小八卦:你可能注意到了,500TB之後經過一個半月纔有600TB的報告,明顯比以往的節奏慢。這倒不是測試硬盤們出了問題,而是TechReport的評測人員跑去泰國海邊度了兩個星期的假(恨……),所以才拖到現在。



好了迴歸正題,先來看重分配扇區的最新趨勢。


840在寫入100TB之後第一個出事兒了,開始出現壞塊並被重新分配,之後一直穩定增加,現在已經達到了2192個,遠遠超過其他硬盤,TLC NAND閃存的天然缺陷暴露無遺。

 

不過即便這樣也只損失了大約3GB的容量,而硬盤的冗餘容量有23GB,所以仍然不是回事兒,可用容量還是完整的。照目前這種線性增加的趨勢,要向耗盡這些冗餘容量可得不少時日。

 

其他硬盤都是MLC閃存的,情況好得多,壞塊在慢慢增加但基本可以忽略不計:HyperX 3K(不可壓縮數據版)的從4個增至10個,840 Pro則從2個增至28個。

 

Intel 335仍然是隻有1個,而海盜船的Neutron GTX堪稱逆天,至今仍無任何損失。

 

另一塊HyperX 3K因爲寫入的是可壓縮數據,主控壓縮後的實際寫入量小得多,也安然無恙。

那麼性能呢?


4MB持續讀取


4MB持續寫入


4KB隨機讀取


4KB隨機寫入

 

真沒什麼好說的,不管壞塊多寡,各個硬盤的性能都始終極其穩定,除了偶爾莫名其妙的起伏之外根本沒受到任何影響。


擦除後的平均寫入速度也波瀾不驚。840開始階段明顯下滑了一些,之後就穩住了。海盜船Neutron GTX又一次逆天,竟然還在緩慢增長!

 

600TB是個什麼概念?即便是每天寫入300GB,足夠你用五年半。這就是說,就算是840這樣看似不靠譜的TLC固態硬盤,也足夠任何普通用戶折騰的,這種連續寫入的測試也不知道什麼時候才能弄死它。

 

TechReport最後表示,如果未來一段時間沒有太明顯的變化,700TB、800TB、900TB階段可能就不出來單獨報告了,直接等1PB(1000TB)。




固態硬盤連續寫入1000TB:終於弄死三個!

TechReport的固態硬盤連續寫入耐久性試驗仍在繼續。將近四個月前,他們公佈了600TB節點的情況,所有固態硬盤依然工作正常、性能穩定,只是三星840在以穩定的頻率損耗TLC閃存單元,部分MLC閃存的也出現了壞塊。

 

對於這些頑強的傢伙,測試人員表示有些“厭倦”了,不打算每100TB公佈一次報告,而是直接等1PB,也就是1000TB。

 

現在,這一里程碑終於達成了,想看熱鬧的絕對不要走開喲。

 

還是再次回顧一下參測的固態硬盤吧:

- 海盜船Neutron GTX 240GB

- Intel SSD 335 240GB

- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮數據)

- 三星840 250GB

- 三星840 Pro 256GB

前景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

固態硬盤連寫500TB:個個都是“豬堅強”

固態硬盤連寫600TB:這都弄不死你們

迄今爲止,已經有三塊最終倒下了,佔總量的一半,而且死去的方式各不相同。


【第一個犧牲品:金士頓HyperX 3K】

 

這一款其實有兩塊,分別測試可壓縮、不可壓縮數據。你應該能想到,失敗的是不可壓縮那塊。

 

它最後的寫入量是728TB,而可壓縮那塊只寫入了501TB。

 

第一次出現警告信息是700TB的時候,忽視它繼續,725TB時再次報錯,而這次來自系統:“Windows檢測到一個硬盤錯誤。立即備份你的數據,以免信息丟失。”

 

不管它接着繼續,又出現了幾次警告,只過了3TB就不行了,Anvil開始報錯。硬盤還能訪問,但是在導出最後一批SMART數據之後就變磚了。


事實上,真正指示壽命的並非閃存顆粒完整性,而是損耗指數(MWI),大部分第一方和第三方工具都以它爲基準,指示固態硬盤的剩餘壽命。

 

該指數在出廠時爲100,一經使用就開始逐漸降低,最終爲0的時候耗盡壽命(理論上仍然可以繼續使用一段時間),而它和重新分配的扇區數量是完全無關的。

 

查看可知,700TB的時候降到了10,728TB時變爲零。

 

再來看看錯誤趨勢:


其實過了上一次的門檻600TB,各種錯誤就開始迅速增加了,到最後有986個重分配扇區(600TB時僅有10個)、111個編程錯誤、381個擦除錯誤。這意味着,失效的扇區裏有一半是因爲ECC錯誤校驗失敗。

 

HyperX 3K設定了一定比例的冗餘容量,但用途是內部管理功能和RAISE(SandForce的冗餘技術),能用來重新分配的很少,因此很快就會耗盡。

 

金士頓表示,壽命到期後硬盤就會拒絕加載,自然就檢測不到了。

【第二個犧牲品:Intel SSD 335】

 

寫入量同樣達到700TB的時候,SMART信息就發出了失敗警告,但是使用起來仍然一切正常,閃存單元也幾乎都是完整的,只有一個重分配扇區,還是寫入300TB時候出現的。

 

於是繼續寫入,但僅僅又過了50TB,也就是到達750TB,最終就崩潰了。負責持續寫入的Anvil Storage Utilities工具裏出現了寫入錯誤,程序本身也失去了響應。幸運的是,再次啓動軟件成功了,至少能提取出日誌(稍後分析),但不能再繼續寫入了。


SSD 335寫入了700TB之後,WMI指數就已經歸零,標誌着閃存不再可靠,不能繼續使用了。

 

奇怪的是,寫入報錯後,SMART也不再返回任何信息,任何工具都無法訪問,證明SMART技術已經掛掉。

 

重啓系統,Intel SSD Toolbox裏又出現了這塊硬盤,仍然檢測爲存儲設備,但容量是0GB,無法訪問。

 

Intel表示,這種結果完全符合預期,寫入錯誤意味着硬盤進入了只讀模式,並觸發一種自毀模式,讓硬盤不再響應。永別了……


【第三個犧牲品:三星840】

 

TLC閃存的它並不是率先倒下的,僅此一點就可以讓大家放心了。它堅持超過了900TB。

 

其實,剛過200TB她就出現了重分配扇區,之後不斷增加,最後有接近3500個,但因爲可用的冗餘空間較多,所以堅持得比較久一些。

 

寫入量達到900TB的時候,840仍然看起來很正常,三星自己的SSD Magician工具也報告還有不少剩餘壽命,但是突然之間,它就掛了,Anvil崩潰,系統和工具都檢測不到,只有Intel存儲驅動報告了一個未知的三星SATA設備,也只能看看而已。

 

由於沒有任何事先警告,死的又很徹底,最後一段時間的SMART數據就丟失了,無法得知最後確切寫入了多少,狀態分析也只能截止到900TB。


損耗指數在300TB的時候就變成了零,但是三星自己的工具仍然報告狀態健康,繼續使用也沒問題。

 

再看可使用的保留空間,一直在穩定減少,但是最後死亡的時候仍有大約40%,理論上還能堅持。由於SMART日誌丟失,無法得知死亡的確切原因,可能是突然就堅持不住了。


再看另一個重要參數:不可修復錯誤。它是在寫入300TB時候出現的,有176個,當時用來校驗數據完整性的200GB文件確實Hash失敗了好幾次,不得不重新拷貝,但此後不可修復錯誤一直沒有增加。

 

在800-900TB之間的某個時刻,不可修復錯誤數量突然增加了119個,總量達到295個。雖然這時候Anvil沒有報錯,但這應該就是死亡元兇。

 

三星表示,840用戶最終是應該能看到錯誤提示的,比如說兼容性錯誤、藍屏死機等。至於這裏爲何突然死亡,還在進一步調查。


【1PB俱樂部:三位堅強鬥士】

 

海盜船Neutron GTX、三星840 Pro、金士頓HyperX 3K(可壓縮數據)都挺過了1PB,真是奇蹟,因爲它們標稱的終身寫入量沒一個超過200TB。



HyperX 3K因爲對付的是壓縮數據,實際寫入閃存的其實只有716TB,節省了幾乎三成。

 

壽命指數最後只剩下了10,不過重分配扇區只有2個,沒有編程和擦寫錯誤(不可壓縮的有上千錯誤),閃存狀態良好。

 

它能堅持到何時還不好預測,估計還能使用很長一段時間,就看重分配扇區何時突增了。


三星840 Pro的壽命指數在400TB時就很低了,500TB後爲零,700TB後開始大量使用冗餘容量,但最後也只用了20%。

 

SSD Magician顯示目前一切良好,但是不敢保證何時會突然死亡。


重分配扇區在600TB之後持續大幅增加,如今已有1836個。每扇區1.5MB,那就是2.7GB,理論上還有很多冗餘可用。


海盜船Neutron GTX仍然牛逼得一塌糊塗,壽命指數竟然至今還接近80!重分配扇區至今還是0!真是一個逆天的存在。照這樣的趨勢下去,至少能堅持到4PB。

 

坐等海盜船解釋……

【性能測試】

再來看看各款固態硬盤的性能趨勢,包括那些死去的。


4MB持續讀取


4MB持續寫入


4KB隨機讀取


4KB隨機寫入

 

大多數都始終如一。HyperX 3K最初曾有明顯的隨機讀取暴漲,但此後基本穩定。

 

海盜船Neutron GTX一直是最穩健的,不過最後一次持續讀取測試出現了大幅度下降,反覆測試五次都是如此。原因不明,等到1.1PB的時候再看看。

 

三星840最後一次隨機讀取速度有所下滑,可能和將死有關。


平均寫入速度也都波瀾不驚。840 Pro還在高低跳躍,Neutron GTX還在緩慢增加,真是無語了。

 

那些突起峯值不用理會,都是每100TB安全擦除後的乾淨狀態。


不妨再看看死去三款固態硬盤最後時刻的表現,很明顯都出現了波動,Intel、金士頓的還很輕微,三星840的就激烈多了,只可惜沒有死亡前的數據。

【結語:死得其所】

 

1PB是個里程碑。那些通過了的固態硬盤可喜可賀,沒有達成的也不用沮喪,你們同樣證明了自己的價值,並且提供了很多寶貴經驗。

 

直到最後時刻,失敗的固態硬盤纔出現些許性能波動,這證明一款固態硬盤完全可以在整個生命週期內維持良好的性能。

 

不過,不同設備最後終結的方式略有不同。Intel SSD 335預先設定好了界限,一旦越過就“自殺”,金士頓HyperX 3K則力圖壓榨出最後一絲潛力。

 

三星840一直是焦點,最終雖然死的很突然,很蹊蹺,但再一次證明TLC閃存也可以很耐用。雖然這是以大量重分配扇區爲代價的,但對容量的影響很微小。

 

儘管測試的樣品不多,但完全可以拍着胸脯告訴大家:即便你在固態硬盤上每天不停地寫入,只要不是人品太差,700TB也是毫無問題的!

 

接下來,剩餘的三名鬥士將繼續接受考驗……



固態硬盤連寫1500TB:最神奇的莫名完蛋了!

TechReport進行的固態硬盤持續寫入試驗在不久前跨過了1.5PB的大關,換用大家更熟悉的計量單位就是1500TB。都說閃存很脆弱,但是消費級產品能夠堅持到PB級別,相信絕大多數人都沒有想到吧。

 

當然了,畢竟是消費級產品,畢竟不是專爲超大數據量持久寫入而設計的,參與測試的六塊固態硬盤陸陸續續出現了各種問題。1PB就幹掉了其中的三塊,現在又犧牲了一個,而且是最沒想到的一個。

 

前景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

固態硬盤連寫500TB:個個都是“豬堅強”

固態硬盤連寫600TB:這都弄不死你們

固態硬盤連寫1000TB:終於弄死三個!

參測固態硬盤:

- 海盜船Neutron GTX 240GB

- Intel SSD 335 240GB (已死)

- 金士頓HyperX 3K 240GB(可壓縮)

- 金士頓HyperX 3K 240GB(不可壓縮數據) (已死)

- 三星840 250GB (已死)

- 三星840 Pro 256GB 


其中海盜船之前一直表現穩健,沒有任何錯誤,沒有任何性能下滑,事實上性能反而在持續緩慢上升,實在難以理解。

 

但同樣難以理解的,是它的突然死亡。

 

寫入約1.1PB之時,Neutron GTX出現了三個重分配區塊,按說不多,S.M.A.R.T.警告卻很快就出現了,說原始讀取錯誤率超過了閾值。

 

即便如此,仍然看似風平浪靜地堅持到了1.2PB,但檢測發現重分配區塊數量暴漲,已經超過了3400個。


然後就完蛋了。準備進入下一個階段的時候,系統無法啓動,而之前幾塊固態硬盤就是這麼死的。熱插拔也無效,能檢測到硬盤,但是訪問的時候磁盤管理器失去響應。

 

這根本不科學啊。固態硬盤掛掉之前,理應有一段緩衝期,尤其是應該進入一段只讀狀態,方便用戶轉移、保存數據,但是Neutron GTX突然就徹底無法訪問了。


Neutron GTX S.M.A.R.T.屬性裏的參數還是很豐富的,但都比較奇怪。重分配扇區指標就有倆,一個從0開始,一個從256倒數,其中後者到死都沒有歸零。

 

剩餘壽命也在一直穩定遞減,但到最後也還有很多。

 

剛纔說的原始讀取錯誤率最後顯示爲零,但並不完全準確。1108TB之後它就已經到了最低值,也就是錯誤最初開始出現的時候。

 

Neutron GTX的死因仍待進一步調查,海盜船也未提供扇區尺寸、冗餘替換比例等指標。

【最後兩位勇士】

三星840 Pro、金士頓HyperX 3K(可壓縮數據)都突破了1.5PB,還都完成了另外一次不加電存留測試。1.5PB寫入後,二者都載入200GB測試文件,然後斷電拔開,閒置一個星期,再次加電啓動,MD5 Hash測試順利通過,說明數據都完好無損。

 

Anvil Storage Utilities工具對720MB小文件進行的Hash檢測同樣沒有任何錯誤。


840 Pro的出錯速度在降低,但也有了3400多個重分配扇區(跟海盜船死前的差不多),每個1.5MB那就是損失了大約5GB。


損耗均衡指數早在500TB前後的時候就徹底歸零了,到現在又寫入了1PB,但用掉的冗餘空間比例還是不到40%,仍然有很大的餘地。

 

三星SSD Magician工具顯示健康度仍然是良好(good),不過別忘了,840死前也是給的這個評級呢,看來很不靠譜。

 

HyperX 3K使用的SandForce主控支持壓縮寫入技術DuraWrite,這是第二塊堅持至今的一大功臣。


主控寫入1.5PB,而得益於壓縮,實際寫入閃存的之後大約1.07PB,也就是節省了三分之一。另一塊寫入不可壓縮數據的,因爲寫入放大的存在,實際寫入一直略高於主控寫入。

 

如果壓縮是維持其生存的唯一原因,那麼在1.1PB左右就應該支撐不住了,不可壓縮版就是這時候掛掉的,內置的健康指數也在那時候報警了。


但是,1.5PB寫入完成後,這貨仍然只有區區12個重分配扇區!不知道是不是這塊盤的體質特別好,這種差異在半導體產品上是極爲正常的,不過至少兩塊盤是同時抵達的,測試方法也完全相同。

 

再細挖S.M.A.R.T.數據,又發現了一些有趣的地方。


900-1000TB之間出現了2個不可恢復錯誤,恰恰就是頭兩個重分配扇區出現的時候,不知道是否巧合。無論如何,不可恢復錯誤是很致命的,它們會損壞數據、崩潰程序,甚至搞死整個系統。

 

編程與擦寫錯誤分別有2個、3個,但它們都不致命,能夠將其中的數據轉移到其他完好區塊上。性能可能會略有影響,但關係不大。


【現在性能咋樣?】

好了,來看看讀寫性能的歷史變化吧。當然到最後就倆了。


持續讀取


持續寫入


隨機讀取


隨機寫入

 

儘管有一些波動,但幾乎所有固態硬盤自始自終性能都很平穩。

 

海盜船Neutron GTX在到達1PB的時候,持續讀取出現了大幅度下滑,但在1.1PB節點恢復正常,可惜死之前又下去了。

 

三星840 Pro的持續寫入有些反覆,其他很穩定。

 

金士頓HyperX 3K雖然性能相對較低,但也表現穩健。


安全擦除後的性能,840 Pro依然頻繁跳躍,HyperX 3K還是穩定但週期性來個峯值。

 

Neutron GTX之前一直在緩慢爬升,不可思議,不過到最後,很突然地,它就完蛋了。


再放大看最後一段。發現沒?其他固態硬盤失效之前都出現了微弱的下滑,唯有海盜船,升着升着,就走了。

【下一個目標:2PB!】

雖然只剩下了兩位,但是TechReport表示試驗仍將繼續進行下去,而獲得的那麼多寶貴經驗是以前從來沒有過的。

 

最關鍵的是,現代消費級固態硬盤的可靠性遠遠超出了一般想象,應付典型的日常使用實在是綽綽有餘。全部六個試驗品都毫無問題地寫入了幾百TB數據,後期雖然有各種各樣的小毛病,但繼續使用仍然影響不大。

 

另一方面,固態硬盤在到達預期壽命之後,問題和失效現象各有不同。大多數都能預先給出警告,甚至包括海盜船Neutron GTX,但也有說死就死的,因此在使用了很久之後,備份很重要。

 

840 Pro作爲三星的旗艦產品,表現着實不俗(當年誇


它完美還真不虧),而且至今看起來很健康,還能繼續堅持下去。

 

金士頓HyperX 3K雖然憑藉數據壓縮堅持至今,但也出現了一些致命錯誤,下一步很可能會倒下。

 

因此,840 Pro已經成了事實上的贏家。

 

截至目前,這兩塊盤都已經寫入了1.6PB,而不把它們弄死,這個試驗就不會結束!

 

2PB見……如果你們能堅持到的話……



固態硬盤連寫2000TB:這倆貨還不死!

 

2013年8月份,TechReport發起了一項固態硬盤耐久性試驗,找來六塊盤進行持續的數據寫入,看看它們能堅持多久。結果是驚人的,這些消費級產品標稱的壽命都不是很長,但最終都大大超出了理論值。

 

上一次檢查截止到1500TB寫入數據,三星840 250GB、Intel SSD 335 240GB、金士頓HyperX 3K 240GB(不可壓縮)、海盜船Neutron GTX 240GB先後光榮地倒下了(具體過程參見此前的文章),只剩下了金士頓HyperX 3K 240GB(可壓縮)、三星840 Pro 256GB。

 

近日,2000TB(2PB)節點也達成了,後邊這兩個竟然還在頑強地堅持着,都沒什麼問題,第五次不斷電數據完整性測試也順利通過。

 

前景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

固態硬盤連寫500TB:個個都是“豬堅強”

固態硬盤連寫600TB:這都弄不死你們

固態硬盤連寫1000TB:終於弄死三個!

固態硬盤連寫1500TB:最神奇的莫名完蛋了!



【三星840 Pro:近乎完美的表現】


不愧是三星的招牌產品,本次測試中基本找不到什麼毛病,不可恢復錯誤至今爲零,只有一些重分配扇區,寫入600TB的時候開始出現,此後一直緩慢增長,如今已有5591個。

 

這相當於大約8GB的容量,看起來不少,但只佔256GB總容量的3%。


SMART屬性顯示,目前已經消耗了61%的冗餘容量

 

損耗均衡指數在500TB左右的時候就歸零了,再次證明這個參數並不等於壽命。

 

三星的監控軟件裏仍然將健康狀態標註爲“良好”,不過別忘了,三星840在掛掉之前也一直是良好狀態,所以並不足爲信。

從目前的情況看,840 Pro堅持到3PB基本不會有啥問題。

【金士頓HyperX 3K:主控算法立大功】

金士頓本次貢獻了兩塊盤,分別寫入可壓縮、不可壓縮數據。SandForce主控支持DuraWrite技術,可以對數據進行壓縮再寫入,減輕閃存負擔,並加速性能,堅持至今的就是可壓縮版本。

 

不過它寫入的也不是純粹的可壓縮數據,還有46%是不可壓縮的連續數據。其他盤都是100%不可壓縮數據。


閃存實際寫入了1.4PB多點,節省了將近600TB,不過這顯然不是它一直活着的唯一原因,SMART參數裏還有祕密。 


標稱壽命也早就到期了,但重分配扇區都極少,至今僅僅31個,也就是相當於124MB。比上次檢查時的12個多了一些,但依然太少了!


不可恢復錯誤還是最早出現的那2個,沒再增加,多出來的都是編程或者擦寫錯誤,它們都是可以恢復的,不會導致數據丟失。

 

繼續下去,這塊盤似乎遠未到終點,但是死亡隨時可能突然降臨。另一塊金士頓的盤在最後128TB寫入中,重分配扇區就從10個突然猛增到了1000個,然後就掛了。

【這時候的性能咋樣?840 Pro有些“跳”】

所有盤都在測試開始前記錄了原始性能,然後每隔100TB重新測試一次,觀察變化趨勢。


持續讀取


持續寫入


隨機讀取


隨機寫入

 

840 Pro的持續寫入性能在1.2PB之後開始有了一些上下波動,但在接近2PB時似乎又穩定下來了。

 

HyperX 3K的隨機讀取也有輕微的起伏,但一直都是如此,影響很小。

 

除此之外,兩塊盤都很平穩,並沒有明顯下滑。


平均寫入性能變化,二者都延續了此前的趨勢,不夠可以看出,840 Pro的確有些變慢了。峯值都是安全擦除後的。

【終點在哪裏?】

如果有人在測試開始前告訴我,普通的固態硬盤也能寫入2PB數據,我是不會相信的,但沒想到真做到了。

 

2PB啊,也就是2000TB。就算你每天寫入1TB,也能使用5年半。這已經超出了99.99%用戶的日常需求。

 

事實上,六塊參測硬盤都毫無問題地寫入了幾百TB,均超過了預期壽命。

 

雖然測試樣品並不夠多,測試方法也比較單一,產品的個體差異也經常會很明顯,並不能就此斷然地下結論,說固態硬盤是多麼多麼牢固,但至少我們可以打包票地說,對於幾乎任何普通消費者來說,絕對沒必要擔心固態硬盤的可靠性,TLC都綽綽有餘。


接下來,三星840 Pro、金士頓HyperX 3K仍將繼續孤獨地前行,但是誰也不知道終點在哪裏,看上去3PB將會小菜一碟。

 

840 Pro的重分配扇區數量比較多,寫入性能也有所下滑,但沒有致命錯誤。

 

HyperX 3K雖有兩個不可恢復錯誤,但沒再增加,重分配扇區也不是很多,而且有主控壓縮算法的保護,如果沒有什麼突然意外有望成爲最終的勝利者。當然了,即便如此,排除數據壓縮因素後,840 Pro是最值得驕傲的。 



固態硬盤連寫2500TB:終於……全死了!

 

固態硬盤已經是現在裝機的必備選項了,超快的速度都有點讓人再也不想用機械硬盤了,但圍繞着固態硬盤,揮之不去的是壽命問題,特別是隨着閃存工藝的進步,顆粒耐久性反而一路滑坡,還有廉價但更“短命”、引發諸多非議的TLC,更加深了很多用戶的憂慮。

 

那麼,消費級固態硬盤的可靠性究竟有多高?如果連續不停地寫入數據,能堅持多久?一年半多之前,TechReport就決心找出一個答案來,於是裝上六塊固態硬盤,開始了前所未有的殘酷折磨。


前景回顧:

固態硬盤可靠性測試:寫入22TB數據之後……

固態硬盤耐用性試驗:200TB重壓下的壞塊

固態硬盤連續寫入300TB:Intel 335也“壞了”

固態硬盤連寫500TB:個個都是“豬堅強”

固態硬盤連寫600TB:這都弄不死你們

固態硬盤連寫1000TB:終於弄死三個

固態硬盤連寫1500TB:最神奇的莫名完蛋了

固態硬盤連寫2000TB:這倆貨還不死

三星840 250GB、Intel SSD 335 240GB、金士頓HyperX 3K 240GB(不可壓縮)、海盜船Neutron GTX 240GB先後在1500TB節點前不幸掛掉,但這也大大超出了它們的預期壽命,而且各自的“臨終”表現都截然不同,最關鍵的指標重分配扇區也差異很大。

 

具體情況這裏就不再贅述了,可參考上述之前的一系列文章。


金士頓HyperX 3K 240GB(可壓縮)、三星840 Pro 256GB則繼續堅持着,一路走過了2000TB,不過很可惜,都沒能達到2500TB。

【金士頓HyperX 3K 240GB(可壓縮)】


SandForce主控支持寫入壓縮,可大大減輕閃存顆粒的寫入壓力,爲此測試中使用了兩款HyperX 3K,分別寫入不可呀搜和可壓縮數據(壓縮率46%)。


前者在寫入728TB的時候就掛了,比從主控得到的數據略多一點,符合預期。

 

可壓縮版的實際閃存寫入量則少了28%,因此直到1100TB的時候,才和它的兄弟齊平,最終一直堅持到2100TB才倒下。


看這張圖就知道它多能堅持了。剩餘壽命指數是考慮了數據壓縮因素的,因此這麼耐操並不僅僅是SandForce主控的貢獻。看看重分配扇區數量,直到最後都不到50個,這顯然說明金士頓使用的閃存顆粒素質是過硬的,當然也有可能測試的這塊尤其突出,不排除幸運因素。


寫入到900-1000TB的時候,這塊盤纔開始出現重分配扇區,並且出現了兩個嚴重的不可糾正錯誤,但在此之後並未增加,只是多了一些編程和擦寫錯誤。

 

其實在最後,這塊盤的倒下是有些冤的,屬於“非正常死亡”。去年聖誕期間,測試人員放假離開了實驗室,期間斷了一次電。回來後重新啓動,系統很正常,但訪問這塊HyperX 3K的時候就鎖死了,再次重啓就檢測不到了,SMART信息也無法訪問。

 

所以說如果沒有這次意外的話,它還有希望繼續堅持一段時間,理論上能撐到把冗餘容量給耗盡。

 

同時也說明,固態硬盤很怕掉電,尤其是生命的後期階段,一定要小心。

【三星840 Pro】


三星這款旗艦產品雖然也有一些不足之處,但總體來說堪稱一塊完美的固態硬盤,性能優異,可靠性也是極佳。

 

進入2015年,整個測試平臺就剩下它屹立不倒了。2月底,測試人員要去休假一週,臨走的時候還想着不會有事兒,結果遭遇烏鴉嘴。

 

回來後重新加載測試軟件Anvil Storage Utilities,結果沒有響應了,用於檢測SMART數據的HD Sentinel同樣如此,二者界面都是一片空白。

 

Windows資源管理器中訪問840 Pro,立即崩潰。Intel SATA驅動則提示說,硬盤與系統失去連接。

 

和TLC閃存的840一樣,它死之前也沒有任何警告,但不知道和這次長達一週的休息是否有關。


重分配扇區在600TB後出現,此後數量一直在增加,但很穩定。最終它寫入了2400TB,重分配扇區超過了7000個,相當於消耗了10.7GB的閃存容量,但是還有大約1/5的餘量。

 

更關鍵的是,它一生都沒有出現不可糾正錯誤。


損耗均衡指數其實在500TB前後就歸零了,相當於此後一直在超期服役。

【最後的性能分析】

好了,最後一次,看看它們各自整個生命歷程中的讀寫性能變化吧。


4MB持續讀取:HyperX 3K、840 Pro始終都平靜如水。


4MB持續寫入:HyperX 3K一直很淡定,840 Pro則曾經有些跳動,1900TB之後穩定了些,但過了2200TB又開始下滑了,沒再過來。


4KB隨機讀取:HyperX 3K最後反而有所上揚,此前也有較大起伏。 


4KB隨機寫入:所有硬盤都沒有明顯波動。840 Pro各項指標一直都是最好的,完美不是吹的。


平均寫入速度:因爲測試方法的緣故,這個統計不能用來對比各塊硬盤,但也能反映出各自的變化趨勢。除了一些峯值,各塊盤總體上還是比較穩定的,除了海盜船最後突然就掉下來了。

【還怕會寫壞固態硬盤嗎?】

TechReport說這是他們做過的耗時最長,也最累的評測了,但一切都是值得的,完全可以消除大家對固態硬盤的擔心了。

 

要知道,即便是大家最不放心的TLC閃存三星840,也毫無任何問題地寫入了300TB,而且直到超過700TB才寫死一個,還不是840。

 

840 Pro最終達到了2400TB,也就是2.4PB,這是驚人的,很多企業級固態硬盤都不會標稱這麼多的終身寫入量。如果一位用戶每天寫入1TB,那也要六年半之後才能搞死它。


當然了,這裏測試的硬盤有些偏少,而且產品體質往往會有差異,但這並不影響我們的結論。

 

只不過不同品牌的固態硬盤,最終失敗的表現很不一樣。Intel、海盜船、金士頓都發出了SMART警告提示,讓用戶有所準備,只是有些太早了,其實完全可以再用很久。

 

另外從HyperX 3K、840 Pro等最後的結局看,固態硬盤對掉電是很敏感的,比機械硬盤更敏感,而除了極少數產品之外,消費級固態硬盤都不支持掉電保護,所以一定要儘量確保供電的穩定性,而且系統不要閒置太久,時不時得熱熱身。

 

還有不少玩家質疑本次測試中簡單粗暴的連續寫入並不符合實際使用情況。確實如此,但任何理論測試都只能儘量去模擬,而不可能完全重現真實應用。誠然,想考察固態硬盤的可靠性還有更多、更好的方法,但這樣連續寫入其實也不失爲一個簡單有效的途徑。

 

簡而言之一句話:消費級的固態硬盤就放心用吧,不會輕易寫壞的! 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章