Сотрудник Carnegie Mellon University, доктор Бьянка Шрёдер опубликовала собственное исследование случаев выхода из строя жёстких дисков. Напомним, некоторое время назад той же проблеме был посвящен материал, опубликованный Google.
Именно работа Шрёдер была удостоена награды FAST'07 Best Paper в категории "академическое научное компьютерное исследование".
Материалом выступило около 100 тысяч жестких дисков, в том числе, установленных в кластерах Лос-Аламоса и Питтсбургского суперкомпьютерного центра, а также у нескольких провайдеров интернет-сервисов.
Вот некоторые ключевые выводы, сделанные Шрёдер, по результатам анализа.
Была отмечена крайне малая разница в проценте выхода из строя накопителей, оснащенных интерфейсами SCSI, Fibre Channel и SATA, иначе говоря, между дисками "промышленного" и "потребительского" предназначения.
"Детская смертность" дисков, по мнению исследователя, не является недооцениваемой проблемой. В этом отчёт отличается от точки зрения Google. Процент выхода из строя накопителей, по словам Шрёдер, растет с их сроком службы. Отчет полагает, что "детская смертность дисков" достаточно верно оценивается производителями, основной же проблемой на самом деле является ранний износ жёстких дисков, то есть существенный рост поломок после года работы. В настоящее время стандартом IDEMA (International Disk drive Equipment and Materials Association) предусмотрены нормы выходов из строя для дисков отработавших 1-3, 4-6, 7-12 и 13-60 месяцев. Действующий стандарт, по мнению исследователя, не учитывает постоянного роста количества поломок, начиная со второго года службы диска, и нуждается в доработке.
Средний ежегодный процент выхода из строя дисков колеблется в диапазоне от 0,5% до 13,5%. Средневзвешенный уровень поломок составил 3% ежегодно (заявленный производителями HDD - 0,88%). Исследователь делает заключение, что заявляемый производителями срок наработки на отказ в размере, в среднем, миллион часов, не соответствует действительности. Реально этот показатель составляет 300 тысяч часов.
Шрёдер отметила, что в случае выхода из строя одного из дисков массива существенно повышается вероятность сбоя носителя, дублирующего одну и ту же информацию.
К сожалению, данных по производителям HDD в данном отчете, как и в исследовании Google, представлено не было.