當 RAID5 其中一顆硬碟出現異常更換硬碟解決之道-QNAP NAS

由於家中主要的事業是攝影工作,所以需要一個 NAS 來管理檔案以及分享檔案給客戶,於是我幾年前就購入了這台 QNAP TS-469L 共裝有 3TB*4 的 WD 紅標硬碟,並且組 RAID5 來保護資料的安全。至於什麼是 RAID5 呢?大家都知道硬碟都會有一定的機率損壞,至於哪牌子比較耐用覺得都是個人運氣問題,所以當我們不知道硬碟什麼時候離開人世時,只能多加備份、定期檢查硬碟健康狀況以及組 RAID5 來減少硬碟壞掉的風險。RAID5 簡單來說就是允許一顆硬碟壞掉也不會造成立即性的資料損毀,缺點就是可以使用的容量會略微減少。

每個月我都會排一天來進行 RAID 清洗以及檢查硬碟的健康狀況。如果硬碟有任何問題就可以立馬安排做後續的處理。

硬碟異常

就在這個月月初我發現 NAS 有一顆硬碟發生異常

異常的 SMART 資訊是 Current Pending Sector 意思是 目前擱置的磁區 也就是俗稱的 壞軌,雖然才出現一個壞軌不至於有立即性危險,但我的原則是只要發生問題就需要換掉這顆有問題的硬碟。

更換硬碟

正常來說一般的 NAS 都支援熱插拔,也就是說可以不用關機就可以更換硬碟。所以確認好損壞的硬碟的位置後就請安心的直接把硬碟拔出來。然後再將新的硬碟更換上去即可。

RAID Rebuild

將新的硬碟更換上去之後,系統就會開始自動的 RAID Rebuild。

重建會消耗一些系統的效能,但我覺得重建優先,所以我直接將優先權調到最高,速度直接提升到近 100 MB/s,大約七個小時即可 Rebuild 完成。

結語

雖然有人說 RAID Rebuild 的失敗機率很高導致 RAID 損毀。這我覺得後面有一個很大一部份原因是大家在組 RAID 時都會一次買好硬碟,時間久了可能每顆硬碟都處於高風險階段並且使用時間都很高,導致後面 Rebuild 的時候很大的機率又會出現第二顆硬碟損壞。

所以當你一顆硬碟有問題時,第一要點就是先把重要資料備份出來,然後盡快的將有問題的硬碟更換下來最為保險,不要等到整顆硬碟離線以後才做更換,這樣才可以降低 Rebuild 的失敗機率。

有話大聲說!