Самодиагностика жесткого диска
Знакомство с технологией самодиагностики дисков S.M.A.R.T.
Несмотря на важность таких критериев, как скорость работы или шумность диска, самым главным качеством HDD остаётся надёжность. И естественно, она тоже должна как-то измеряться и оцениваться. Уже почти 20 лет в качестве основного диагностического стандарта используется технология S.M.A.R.T. Как пишут в Википедии, S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
История S.M.A.R.T.
Появление технологии мониторинга состояния накопителей на жёстких магнитных дисках стало естественным ответом на возрастающие требования к их надёжности. Первая разработка в этой области была выпущена компанией IBM в 1992 году, и называлась PFA (Predictive Failure Analysis).
В 1994 году компаниями Compaq, Seagate, Quantum и Conner была разработана технология IntelliSafe, а уже в 1995 году на её основе появился стандарт технологии S.M.A.R.T.: Self-Monitoring, Analysis and Reporting Technology — «Технология самодиагностики, анализа и отчёта».
После этого их уже поддержали такие компании как IBM, Maxtor и Samsung. Hitachi приняла участие в развитии технологии S.M.A.R.T. уже на стадии разработки SMART II, первыми предложив методику полной самодиагностики накопителя (extended self-test). Сущность технологии описана в стандарте, называющемся «Information Technology — AT Attachment … — ATA/ATAPI Command Set» (Информационная технология — в приложении… — набор команд ATA/ATAPI). Вместо многоточия ставится номер стандарта. Наиболее новая ревизия стандарта-8, является только продолжением и дополнением стандартов 2, 4, 6 и 7. Раздел о S.M.A.R.T. есть в каждом из них.
Этот стандарт описывает принципы, на которых общаются между собой HDD и компьютер. В стандарте описаны только общие правила функционирования S.M.A.R.T., необходимые для совместимости всех жестких дисков со всеми компьютерами — остальные же функции в общедоступной документации не представлены, являются разработками компаний-производителей HDD (вендоров) и охраняются как коммерческая тайна.
Стандарты S.M.A.R.T.
Разберём, как трактует технологию S.M.A.R.T. стандарт АТА-АТАРI (далее курсивом выделены цитаты из стандарта ATA-ATAPI-8):
Назначением технологии S.M.A.R.T. является защита данных пользователя и минимизация вероятности их потери посредством предсказания деградации и/или выхода из строя устройства. Контролируя и сохраняя критические рабочие и калибровочные параметры, SMART устанавливает устройству возможность предсказания ближайшего времени деградации или отказа устройства.
Таким образом, S.M.A.R.T. обеспечивает компьютеру (хосту) возможность узнать о низкой надежности устройства, и предупреждает пользователя об этом, чтобы уменьшить риск потери данных.
Поддержка технологии S.M.A.R.T. указывается в ответе устройства на команду, подаваемую BIOS при опросе подключенных HDD.
Однако устройства, которые поддерживают пакетные команды (это, к примеру, DVD-ROM) не поддерживают S.M.A.R.T. так, как это делают HDD (пакетные устройства общаются с хостом посредством АТА команд, но как бы «обернутых» в оболочку из команд SCSI).
Устройства, поддерживающие пакетные команды, поддерживают S.M.A.R.T. в виде, определённом для таких устройств, с использованием пакетных команд.
Структура данных S.M.A.R.T.-устройства: функция S.M.A.R.T. — устанавливать информацию о надежности и состоянии устройства и хранить эту информацию в специализированных S.M.A.R.T.-структурах устройства. Набор хранимых устройством S.M.A.R.T.-данных может быть использован при запуске команды S.M.A.R.T. EXECUTE OFF-LINE IMMEDIATE (Смарт: немедленно перейти в режим off-line), если эта команда поддерживается устройством.
Такую команду может подавать BIOS (если включена опция отслеживания SMART в BIOS) при считывании информации о состоянии HDD из структуры SMART при запуске компьютера. Следует отметить, что, на самом деле, атрибутов SMART очень много, и они различны у разных вендоров. Пользователю доступна лишь относительно небольшая часть собранной HDD информации, которой, в прочем, вполне достаточно.
Режимы сбора данных в S.M.A.R.T.
Сбор текущих данных S.M.A.R.T. (on-line-режим): Сбор текущих данных S.M.A.R.T. не должен мешать нормальной работе устройства. Данные S.M.A.R.T., которые в настоящий момент собираются, или методы, которыми пользуется технология для сбора данных, могут отличаться от методов, используемых для хранения данных S.M.A.R.T. (типы таблиц и т.п.), и могут также отличаться от устройства к устройству.
On-line режим означает, что HDD производит сбор информации о параметрах чтения/записи во время обработки запросов операционной системы, дискретно записывая полученную статистику в таблицы S.M.A.R.T. Это не сказывается на скорости обработки команд накопителем.
Сбор данных в режиме off-line (накопитель активен, но не выполняет никаких действий по интерфейсу) Устройство может использовать режим off-line для сбора данных и проведения самотестирования. Такой режим работы S.M.A.R.T. может меняться от устройства к устройству. Собранные данные или методики сбора данных в этом режиме могут отличаться от методик, используемых при сборе текущих данных (режим on-line) для любого устройства и могут варьировать от устройства к устройству.
Off-line режим представляет собой самотестирование HDD, при котором устройство производит сканирование определенных областей магнитных пластин, оценивает работу механических частей, тестирует оперативную память и канал чтения/записи. Если вы слышите, как ваш жёсткий диск активно жужжит, в момент, когда у операционной системы нет активных задач — скорее всего, это означает идущее off-line сканирование.
Атрибуты S.M.A.R.T.
Атрибуты S.M.A.R.T. — это характеристики, которые используются при анализе состояния и запаса «живучести» накопителя.
Атрибуты вводятся производителем накопителя на основании собственного опыта производства и эксплуатации HDD. Предполагается, что с помощью этих атрибутов, можно предсказывать ухудшение рабочих характеристик накопителя или определить его дефектность. Каждый производитель имеет свой характерный набор атрибутов, и вносит изменения в этот набор в соответствии со своими собственными соображениями, никого об этом не уведомляя. Конечному пользователю остается только доверять мнению производителя. Значения атрибутов (value) используются для представления надежности отдельного показателя, относительно его эталонного значения. Каждый атрибут имеет собственное пороговое значение (threshold), оно необходимо для сравнения со значением атрибута и указывает на ухудшение рабочих характеристик или дефектность накопителя. Допустимое значение атрибута — относительное, и судить о его величине можно лишь сравнивая его с threshold. Высокое значение атрибута говорит о том, что параметр в порядке и имеет низкую вероятность ухудшения и выхода накопителя из строя. Соответственно, низкое значение атрибута говорит о том, что результат анализа параметра указывает на высокую вероятность его ухудшения или выхода накопителя из строя.
Производитель определяет числовое значение порогового атрибута анализируя результаты испытаний на надежность. Пороговое значение каждого атрибута указывает на нижнюю допустимую границу значения атрибута, до которой накопитель можно считать надежным.
Атрибут Worst — наихудшее значение атрибута за всю историю работы HDD — читается из логов S.M.A.R.T. и помогает понять, в каких условиях работал накопитель.
Атрибут Raw является текущим значением измеряемого параметра. Его размерность, в зависимости от типа параметра, может быть в «разах» (к примеру, количество парковок), градусах, часах и в других величинах (частота ошибок чтения и т.д.).
Продвинутый читатель может заметить, что мы привели не так уж много примеров атрибутов в статье. Это так. Многие программы отображают больше атрибутов, но хотим заверить вас, если изменится значение атрибута, к примеру, «Disk Shift» (смещение пакета дисков относительно оси шпинделя), то ваш диск — труп, и его нужно нести в сервис по восстановлению данных или выбрасывать. Все атрибуты используют только в специальных подразделениях компаний-производителей HDD, так называемых «Failure Analysis», где специалисты исследуют причины отказов дисков. Представленного же в этой статье набора атрибутов вполне достаточно для оценки состояния жесткого диска.
Лог S.M.A.R.T.
Узнать о проблемах в диском можно при загрузке компьютера. Функция контроля состояния S.M.A.R.T. встроена во все современные BIOS – ведь именно для этого и создавалась технология.
При включении компьютера, BIOS непременно известит о плохом состоянии HDD соответствующим сообщением. Проверить не выключена ли эта опция случайно и включить её обратно можно также через BIOS в строчке enable/disable SMART.
Однако BIOS лишь пишет bad или good. Выяснить, в чём именно проблема можно только с помощью специальной программы анализа атрибутов.
Приведём пример лога S.M.A.R.T. типичного, вполне исправного, HDD WD3200AAKS-00L9A0, открытого в программе Smart Vision от Ace Lab:
Как видим, здесь приведены наиболее критичные для надежности HDD атрибуты. Это пример S.M.A.R.T. уже «повидавшего жизнь» диска. Его надежность на удовлетворительном уровне (не превышены атрибуты «1» и «5»), но подумать о неспешной замене стоит.
Рассмотрим каждый атрибут подробнее.
- Частота ошибок чтения: насколько часто возникают ошибки при чтении секторов. Ухудшение значения этого атрибута может свидетельствовать о разрушении магнитного слоя, износе механических составляющих диска, о существенном превышении температуры.
- Время раскрутки шпинделя: если двигатель медленно раскручивает пакет с магнитными пластинами, это может означать потерю мощности двигателя (следовательно, угрозу обрыва провода в обмотке) или увеличение сопротивления в гидродинамическом подшипнике (возникновение заусенца внутри корпуса подшипника, к примеру).
- Количество включений шпиндельного двигателя: счетчик, по нему можно косвенно определить время и режим работы диска.
- Количество переназначенных секторов: критически важный атрибут. Если ошибка чтения часто обратима, и может быть обусловлена условиями работы диска, то ухудшение атрибута «количество переназначенных секторов» явно свидетельствует о повреждении поверхности дисков. Переполнение таблиц дефектов – одна из наиболее часто встречающихся неисправностей HDD.
- Частота ошибок позиционирования: ухудшение этого атрибута может указывать на превышение температуры или износ механических частей.
- Время во включенном состоянии: время работы диска.
- Количество повторных попыток запуска шпинделя: ухудшение атрибута может свидетельствовать об ухудшении состояния двигателя, механики или поверхности магнитных дисков.
Важно. Одной из возможных причин сбоев при запуске могут быть проблемы при считывании сервометок. Электроника HDD управляет скоростью вращения магнитных пластин, считывая особые магнитные метки (сервометки) с поверхности. Если они считываются с перебоями, то HDD не может поддерживать необходимую скорость вращения пластин и останавливает двигатель. Также, с помощью сервометок, HDD определяет, где находятся головки чтения-записи. Так что сервометки имеют фундаментальное значение в работе HDD.
Функции S.M.A.R.T. — известные и предполагаемые
Поскольку производители тщательно скрывают информацию о структуре программ, составляющих систему S.M.A.R.T., доподлинно известной информации о работе этой подсистемы не так много, как хотелось бы.
Перечень функций, о которых можно сказать, что они присутствуют во всех HDD всех фирм, выглядит следующим образом:
- Сбор информации о состоянии диска, ведение журналов ошибок.
- Ведение счетчиков событий (количества включений, парковок, повторных запусков, срабатываний датчика удара и пр.)
- Тестирование систем накопителя и поверхности магнитных пластин.
Расшифровка SMART у HDD. Как читать ошибки жесткого диска?
Как понять, что вашему HDD срочно нужен «доктор»?
Симптомы проблем с жестким диском:
Если при загрузке компьютера появляется синий экран и заново перезагрузка. Часто это говорит о сбойных секторах на жестком диске (тут, конечно, нужно смотреть ошибку BSOD — там дается расшифровка его появления), в частности, boot-секторов, отвечающих за корректную загрузку операционной системы
При запуске системы постоянно запускается утилита chkdsk
Частые зависания при процедуре чтения и/или копирования файлов. Если в процессе перемещения или копирования большого файла таймер оставшегося времени часто стал уходить в бесконечность и больше не возвращается — это тревожный звоночек.
Вы никогда не делали и понятия не имеете, что такое дефрагментация
Ingredients
Directions
Если при загрузке компьютера появляется синий экран и заново перезагрузка. Часто это говорит о сбойных секторах на жестком диске (тут, конечно, нужно смотреть ошибку BSOD — там дается расшифровка его появления), в частности, boot-секторов, отвечающих за корректную загрузку операционной системы
При запуске системы постоянно запускается утилита chkdsk
Частые зависания при процедуре чтения и/или копирования файлов. Если в процессе перемещения или копирования большого файла таймер оставшегося времени часто стал уходить в бесконечность и больше не возвращается — это тревожный звоночек.
Вы никогда не делали и понятия не имеете, что такое дефрагментация
Даже, если вы никогда не слышали про SMART, шпиндель, SATA и другие страшные вещи, то Windows может сама давать недвусмысленные намеки на то, что с вашем жестким диском что-то не так.
Обозначение полей в таблице SMART
Итак, мы уже определили — нам нужно использовать SMART. Теперь детально рассмотрим каждый параметр, на который стоит обратить внимание. Для примера мы возьмем наш жесткий диск компании Western Digitak — модель WD3200BPVT-55JJ5T1 (WD-WX61E82M9996). Срок службы 5 лет.
Кликните, чтобы увеличить изображение
Значение (Value или Current) — текущее значение данного атрибута. Единиц измерений этого нет — некое абстрактное значение, которым пользуется система. Может изменятся в процессе работы HDD. По умолчанию имеет значение 100 или 200 (т.е. это не действительное текущее значение параметра, а выставленное системой). Имеется много споров, действительно ли SMART корректно выставляет параметр «Значение» (Value). Многие склоняются, что точнее и правильней использовать метрику «Данные» (RAW).
В любом случае, «Значение» (Value) нужно сравнивать с «Порогом» (Threshold) — здесь есть нюансы, но в основном, чем ниже Value, тем хуже работает жесткий диск — оно не должно опускаться до порога или сравняться с ним
Наихудшее (Worst) — Самое худшее значение, до которого опускался параметр «Значение» (Value).
Порог (Threshold) — Порог, ниже которого параметр «Значение» Value ни в коем случае не должен опускаться. Threshold — постоянный параметр, который установил производитель жесткого диска. Если это случилось, тогда у диска имеются серьезные проблемы со здоровьем. Однако тут есть один нюанс
Многие SMART-программы показывают, что с вашим диском всё в порядке, ориентируясь на параметры «Значение» и «Порог». Да, действительно, диагностика показывает, что значение не приблизилось к порогу, мол, всё окей. Но они не учитывают параметр Данные (RAW), о котором пойдет речь ниже. Зачастую, именно RAW показывает верные значения, а значит ваш диск может быть в опасности!
Данные (RAW или Data, «Сырое значение») — Наиболее точный показатель с тем, что творится с вашим жестким диском. Это уже не абстрактный параметр, как «Значение» (Value), а вполне реальный показатель. Хотя есть мнение, что именно «Данные» (RAW) влияет на показатель Значения, но иногда эти два типа данных сильно расходятся друг с другом. Иногда программы SMART показывают его в десятичной системе измерения — перевести можно с помощью калькулятора (из HEC в DEC). Например, тут — https://lin.in.ua/tools/numconv.html
Частота появления ошибок при чтении с диска
Raw Read Error Rate
Частота ошибок при операции чтения с жесткого диска. Большое количество ошибок (меньшее значение атрибута) говорит о том, что с аппаратной частью диска не всё в порядке.Чем меньше параметр, тем хуже
Данный атрибут — главный показатель здоровья именно механики жесткого диска. Любое замедление блока магнитных головок может вылиться в ошибки чтения, так же как и падения, удары, перегрев и другие физические воздействия на диск. Тут важно понимать, что появление этих ошибок уже означает отрицательную динамику — их будет только больше. Остается только надеяться, что это не произойдет так быстро.
Главный нюанс атрибута Raw Read Error Rate в том, что именно параметр Данные «RAW» показывает реальное количество ошибок, а не параметр «Значение». Поэтому, даже если SMART-программы вам говорят о том, что всё в порядке, обратите внимание на «Данные». В нашем случае, Value=200, а RAW=1380, т.е. реальное количество ошибок чтения у нас 1380!
Однако и тут есть некоторые особенности. Часто винчестеры фирмы Seagate и Samsung в поле RAW показывают умопомрачительные значения под десятки тысяч или миллионов — понятно, что это неверная информация от SMART-программы — ваш диск при таком количестве ошибок был бы уже труп. ИТОГ: В данном атрибуте надо смотреть на RAW — он показывает реальные данные. Но если этот показатель показывает миллионные значения — то лучше ориентироваться на показатель «Значение» (Value)
Время раскрутки
Pin Up Time
Атрибут показывает время за которое диск (шпендель) разогнался из полного покоя до своей рабочего состояния, до «паспортной» скорости, которую зашил производитель на заводе — оно отображено Значение «Порог» (Threshold). Соответственно «Значение»(Value) содержит текущий показатель, конкретный для этой модели и этого производителя. До порогового значения он опускаться не должен. Чем меньше параметр, тем хуже
Данный атрибут некоторыми SMART-программами выделен как критичный, хотя его критичность, на самом деле, спорна. В целом, на этот показатель можно не обращать внимание, т.к. он говорит, скорей, не о здоровье конкретно жесткого диска, а наличие проблем с его питанием — недостаточное напряжение в блоке питания.
Кол-во переназначенных секторов.
Reallocated Sector Count
Счетчик показывает общее количество так называемых «переназначенных» секторов. Сбойный сектор на диске — это очень плохо, поэтому HDD использует специальную резервную область, куда отныне жесткий диск будет обращаться за данными, вместо этого сбойного сектора. Чем меньше параметр, тем хуже!
Наверное, самый главный показатель здоровья жесткого диска. Если этот атрибут, SMART отмечает как проблемный («Значение» (Value) приближается к «Порогу» (Threshold)) — существуют серьезные проблемы с износом одной из головок или поверхностью жесткого диска. Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому максимального значения у него нет
При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности – G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап, ремапинг) либо переназначение, а используемый вместо повреждённого сектор – переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении за данными к этому сектору (с этим номером) запрос будет перенаправляться в резервную область. А она — не бесконечная.
В данном атрибуте смотрим лучше обращать внимание на «Данные» (RAW), а не на «Значение» (Value). Т.к. VALUE может стоять 200 или 100 (по умолчанию системы, но это не значит, что у вас уже 200 ошибок). Именно поле RAW показывает реальное общее количество переназначенных секторов.Самый идеальный вариант в данном случае — ноль в поле «RAW». Даже единица в этом поле говорит о начавшихся проблемах.
Проблема кроется в том, что данный атрибут показывает число уже переназначенных секторов, т.е. исправить это уже нельзя (даже низкоуровневым формтированием). Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому любое значение отличное от ноля — уже плохо. Это значит что уже есть отрицательная для здоровья HDD динамика.
Ошибки позиционирования
Seek Error Rate
Жесткий диск постоянно находится в движении — его головки скользят по поверхности в поисках данных. Иногда этот процесс сбоит и блок магнитных головок оказывается не в том месте — это ошибка позиционирования. При их наличии имеются повреждения сервометок, возможны проблемы с охлаждением и механической частью (шпендель)
Жесткий диск контролирует правильность установки головок на требуемую дорожку поверхности для считывания данных. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Для данного накопителя причиной большого числа ошибок явился перегрев. Как и в случае с Raw Read Error Rate, «Значение» не должно опуститься ниже «Порога». А в столбце «Данные» (RAW) должен быть (в идеале) ноль.
Текущее количество нестабильных секторов.
Current Pending Sector Count (C5)
Предвестник больших проблем. Данный атрибут показывает количество секторов, которые диск не смог прочитать с первого раза. Операция будет проведена еще раз при повторном обращении к этому сектору. Если он не прочитается и второй раз, то он улетит в переназначенные сектора (Reallocated Sector Count)
Непрочитанный второй раз сектор будет переназначен в резервную область (как мы уже знаем, это называется ремап). Если всё-таки сектор будет прочтен, то он будет помечен, как стабильный и атрибут улучшиться. Ошибки в этом параметре могут быть вызваны банальным выключением ПК из сети или севшим ноутбуком — в общем, некорректным заверением работы Windows.
Как установить Windows 10
- Просмотров: 244 004
- Автор: admin
- Дата: 17-10-2015
Как с помощью программы Victoria произвести посекторное стирание информации с жёсткого диска и этим избавиться от сбойных секторов (бэд-блоков)
Как с помощью программы Victoria произвести посекторное стирание информации с жёсткого диска и этим избавиться от сбойных секторов (бэд-блоков)
- Примечание : кому интересно, более подробная статья о сбойных секторах (бэд-блоках) лежит здесь .
Перехожу на вкладку Tests и отмечаю пункты Ignor и read , жму Start . Запускается простой тест поверхности жёсткого диска без исправления ошибок. Данный тест не опасен для информации, находящейся на жёстком диске. Мне интересно узнать, в каком состоянии жёсткий диск после десяти лет работы. Самое главное не запускать во время теста никаких программ, иначе возможны ошибки, вообще идеально произвести тест HDD в ДОС-режиме с помощью загрузочной флешки программы Victoria, но мы сделаем это чуть позже.
Через 30 минут получаем результат теста:
В нашем случае бэд-блоков нет, но есть сектора с большой задержкой более 600 мc, смотрим на скриншот, всё показано стрелочками.
500 блоков секторов с задержкой более 50 мc.
31 блок секторов с задержкой более 200 мc.
7 блоков секторов с задержкой более 600 мc (блоки секторов с такой задержкой опасны и являются скорее всего кандидатами в бэд-блоки).
Есть небольшая вероятность, что из-за данных семи секторов и происходят зависания компьютера.
Предлагаю применить для жёсткого диска в программе Victoria алгоритм Write (Запись, стирание) на жаргоне ремонтников — «Запись по всей поляне». Произойдёт посекторное стирание информации с диска блоками по 256 секторов и последующая принудительная запись в сектора нулей. Именно таким образом можно избавиться от логических бэд-блоков и в некоторых случаях от физических бэд-блоков (произойдёт ремап).
Логические «бэды» после такой принудительной записи просто потеряют некорректную информацию в своих секторах, она будет перезаписана нулями.
Физические «бэды» могут пропасть от того, что Виктория слишком явно покажет их встроенной микропрограмме жёсткого диска и та просто переназначит бэд-блоки резервными секторами с запасных дорожек!
На вкладке Tests отмечаем пункт Write (Запись, стирание). Осторожно, вся информация будет удалена с жёсткого диска! Поэтому убедитесь, что вы правильно выбрали тестируемый диск. Можете отметить пункт DDD Enable (усиленное стирание).
Will be lost (все пользовательские данные на жёстком диске WD1200JS-00MHB0 будут потеряны).
Начинается процесс посекторного стирания информации с жёсткого диска
Если в данный момент запустить Управление дисками, то мы увидим, что все разделы на тестируемом жёстком диске удалены вместе с данными.
По окончании стирания, опять производим простой тест поверхности жёсткого диска.
На вкладке Tests отмечаем пункты Ignor и read , жмём Start . Запускается простой тест поверхности жёсткого диска без исправления ошибок.
Через 30 минут получаю результат, все сектора с большими задержками исправлены.
Наш ветеран опять в строю.
Сейчас жёсткий диск WDC WD1200JS-00MHB0 снова работает и пока без зависаний.
Примечание: стереть посекторно всю информацию с жёсткого диска можно не только с помощью Виктории, но также программами Acronis Drive Cleanser и AOMEI Partition Assistant Standard Edition.
Как произвести посекторное стирание информации с жёсткого диска в DOS (ДОС) режиме
Друзья, в некоторых случаях у вас не получится произвести посекторное стирание информации с HDD в работающей операционной системе, тогда нужно проделать эту операцию в DOS (ДОС) режиме.
Вам нужно будет создать загрузочную флешку с программой Victoria. Войти в БИОС и переключить работу жёстких дисков из положения AHCI в >Victoria, далее вся работа будет происходить в «DOS» режиме. Читайте об этом в нашей подробной статье: — Как создать загрузочную флешку с программой Victoria и как избавиться от сбойных секторов (бэд-блоков) в DOS (ДОС) режиме.
Расшифровка SMART у HDD. Как читать ошибки жесткого диска?
Как понять, что вашему HDD срочно нужен «доктор»?
Симптомы проблем с жестким диском:
Если при загрузке компьютера появляется синий экран и заново перезагрузка. Часто это говорит о сбойных секторах на жестком диске (тут, конечно, нужно смотреть ошибку BSOD — там дается расшифровка его появления), в частности, boot-секторов, отвечающих за корректную загрузку операционной системы
При запуске системы постоянно запускается утилита chkdsk
Частые зависания при процедуре чтения и/или копирования файлов. Если в процессе перемещения или копирования большого файла таймер оставшегося времени часто стал уходить в бесконечность и больше не возвращается — это тревожный звоночек.
Вы никогда не делали и понятия не имеете, что такое дефрагментация
Ingredients
Directions
Если при загрузке компьютера появляется синий экран и заново перезагрузка. Часто это говорит о сбойных секторах на жестком диске (тут, конечно, нужно смотреть ошибку BSOD — там дается расшифровка его появления), в частности, boot-секторов, отвечающих за корректную загрузку операционной системы
При запуске системы постоянно запускается утилита chkdsk
Частые зависания при процедуре чтения и/или копирования файлов. Если в процессе перемещения или копирования большого файла таймер оставшегося времени часто стал уходить в бесконечность и больше не возвращается — это тревожный звоночек.
Вы никогда не делали и понятия не имеете, что такое дефрагментация
Даже, если вы никогда не слышали про SMART, шпиндель, SATA и другие страшные вещи, то Windows может сама давать недвусмысленные намеки на то, что с вашем жестким диском что-то не так.
Обозначение полей в таблице SMART
Итак, мы уже определили — нам нужно использовать SMART. Теперь детально рассмотрим каждый параметр, на который стоит обратить внимание. Для примера мы возьмем наш жесткий диск компании Western Digitak — модель WD3200BPVT-55JJ5T1 (WD-WX61E82M9996). Срок службы 5 лет.
Кликните, чтобы увеличить изображение
Значение (Value или Current) — текущее значение данного атрибута. Единиц измерений этого нет — некое абстрактное значение, которым пользуется система. Может изменятся в процессе работы HDD. По умолчанию имеет значение 100 или 200 (т.е. это не действительное текущее значение параметра, а выставленное системой). Имеется много споров, действительно ли SMART корректно выставляет параметр «Значение» (Value). Многие склоняются, что точнее и правильней использовать метрику «Данные» (RAW).
В любом случае, «Значение» (Value) нужно сравнивать с «Порогом» (Threshold) — здесь есть нюансы, но в основном, чем ниже Value, тем хуже работает жесткий диск — оно не должно опускаться до порога или сравняться с ним
Наихудшее (Worst) — Самое худшее значение, до которого опускался параметр «Значение» (Value).
Порог (Threshold) — Порог, ниже которого параметр «Значение» Value ни в коем случае не должен опускаться. Threshold — постоянный параметр, который установил производитель жесткого диска. Если это случилось, тогда у диска имеются серьезные проблемы со здоровьем. Однако тут есть один нюанс
Многие SMART-программы показывают, что с вашим диском всё в порядке, ориентируясь на параметры «Значение» и «Порог». Да, действительно, диагностика показывает, что значение не приблизилось к порогу, мол, всё окей. Но они не учитывают параметр Данные (RAW), о котором пойдет речь ниже. Зачастую, именно RAW показывает верные значения, а значит ваш диск может быть в опасности!
Данные (RAW или Data, «Сырое значение») — Наиболее точный показатель с тем, что творится с вашим жестким диском. Это уже не абстрактный параметр, как «Значение» (Value), а вполне реальный показатель. Хотя есть мнение, что именно «Данные» (RAW) влияет на показатель Значения, но иногда эти два типа данных сильно расходятся друг с другом. Иногда программы SMART показывают его в десятичной системе измерения — перевести можно с помощью калькулятора (из HEC в DEC). Например, тут — https://lin.in.ua/tools/numconv.html
Частота появления ошибок при чтении с диска
Raw Read Error Rate
Частота ошибок при операции чтения с жесткого диска. Большое количество ошибок (меньшее значение атрибута) говорит о том, что с аппаратной частью диска не всё в порядке.Чем меньше параметр, тем хуже
Данный атрибут — главный показатель здоровья именно механики жесткого диска. Любое замедление блока магнитных головок может вылиться в ошибки чтения, так же как и падения, удары, перегрев и другие физические воздействия на диск. Тут важно понимать, что появление этих ошибок уже означает отрицательную динамику — их будет только больше. Остается только надеяться, что это не произойдет так быстро.
Главный нюанс атрибута Raw Read Error Rate в том, что именно параметр Данные «RAW» показывает реальное количество ошибок, а не параметр «Значение». Поэтому, даже если SMART-программы вам говорят о том, что всё в порядке, обратите внимание на «Данные». В нашем случае, Value=200, а RAW=1380, т.е. реальное количество ошибок чтения у нас 1380!
Однако и тут есть некоторые особенности. Часто винчестеры фирмы Seagate и Samsung в поле RAW показывают умопомрачительные значения под десятки тысяч или миллионов — понятно, что это неверная информация от SMART-программы — ваш диск при таком количестве ошибок был бы уже труп. ИТОГ: В данном атрибуте надо смотреть на RAW — он показывает реальные данные. Но если этот показатель показывает миллионные значения — то лучше ориентироваться на показатель «Значение» (Value)
Время раскрутки
Pin Up Time
Атрибут показывает время за которое диск (шпендель) разогнался из полного покоя до своей рабочего состояния, до «паспортной» скорости, которую зашил производитель на заводе — оно отображено Значение «Порог» (Threshold). Соответственно «Значение»(Value) содержит текущий показатель, конкретный для этой модели и этого производителя. До порогового значения он опускаться не должен. Чем меньше параметр, тем хуже
Данный атрибут некоторыми SMART-программами выделен как критичный, хотя его критичность, на самом деле, спорна. В целом, на этот показатель можно не обращать внимание, т.к. он говорит, скорей, не о здоровье конкретно жесткого диска, а наличие проблем с его питанием — недостаточное напряжение в блоке питания.
Кол-во переназначенных секторов.
Reallocated Sector Count
Счетчик показывает общее количество так называемых «переназначенных» секторов. Сбойный сектор на диске — это очень плохо, поэтому HDD использует специальную резервную область, куда отныне жесткий диск будет обращаться за данными, вместо этого сбойного сектора. Чем меньше параметр, тем хуже!
Наверное, самый главный показатель здоровья жесткого диска. Если этот атрибут, SMART отмечает как проблемный («Значение» (Value) приближается к «Порогу» (Threshold)) — существуют серьезные проблемы с износом одной из головок или поверхностью жесткого диска. Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому максимального значения у него нет
При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности – G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап, ремапинг) либо переназначение, а используемый вместо повреждённого сектор – переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении за данными к этому сектору (с этим номером) запрос будет перенаправляться в резервную область. А она — не бесконечная.
В данном атрибуте смотрим лучше обращать внимание на «Данные» (RAW), а не на «Значение» (Value). Т.к. VALUE может стоять 200 или 100 (по умолчанию системы, но это не значит, что у вас уже 200 ошибок). Именно поле RAW показывает реальное общее количество переназначенных секторов.Самый идеальный вариант в данном случае — ноль в поле «RAW». Даже единица в этом поле говорит о начавшихся проблемах.
Проблема кроется в том, что данный атрибут показывает число уже переназначенных секторов, т.е. исправить это уже нельзя (даже низкоуровневым формтированием). Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому любое значение отличное от ноля — уже плохо. Это значит что уже есть отрицательная для здоровья HDD динамика.
Ошибки позиционирования
Seek Error Rate
Жесткий диск постоянно находится в движении — его головки скользят по поверхности в поисках данных. Иногда этот процесс сбоит и блок магнитных головок оказывается не в том месте — это ошибка позиционирования. При их наличии имеются повреждения сервометок, возможны проблемы с охлаждением и механической частью (шпендель)
Жесткий диск контролирует правильность установки головок на требуемую дорожку поверхности для считывания данных. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Для данного накопителя причиной большого числа ошибок явился перегрев. Как и в случае с Raw Read Error Rate, «Значение» не должно опуститься ниже «Порога». А в столбце «Данные» (RAW) должен быть (в идеале) ноль.
Текущее количество нестабильных секторов.
Current Pending Sector Count (C5)
Предвестник больших проблем. Данный атрибут показывает количество секторов, которые диск не смог прочитать с первого раза. Операция будет проведена еще раз при повторном обращении к этому сектору. Если он не прочитается и второй раз, то он улетит в переназначенные сектора (Reallocated Sector Count)
Непрочитанный второй раз сектор будет переназначен в резервную область (как мы уже знаем, это называется ремап). Если всё-таки сектор будет прочтен, то он будет помечен, как стабильный и атрибут улучшиться. Ошибки в этом параметре могут быть вызваны банальным выключением ПК из сети или севшим ноутбуком — в общем, некорректным заверением работы Windows.