Anticiper une panne disque

Clac-clac, tic tic, toc toc ?

Mécaniquement parlant les disques dur font ... du bruit, il s'agit d'un dispositif électro-mécanique et non pas uniquement électronique (comme un SSD), et on est toujours à craindre la panne ...

De fait il y a des bruits ... "normaux" et d'autres "anormaux" ... et il est important de prévenir une panne.

Il y a deux sortes de défaillances, celles imprévisible et celles  ... prévisibles:

  • imprévisible = soudainement comme un composant électronique qui grille, généralement au démarrage du disque
  • prévisible = vieillissement (parfois très prématuré !) et l’usure des composants

Déjà, les bruits "normaux":

  • Bruit de rotation: les plateaux du disques tournent (à 5400 ou 7200rpm en grand public), ce qui génère du bruit, il s'agit le plus souvent d'un "sifflement" qui se caractérise facilement car il est continue (de l'allumage du disque à son extinction, sauf cas de mise en veille mais fortement déconseillé !!!)
  • Bruit des têtes: lors des opérations (en particulier d'écriture), les têtes "grattent" ... ce bruit est généré par les mouvements de va-et-vient du bras lorsque l'actuateur modifie sa position. "Historiquement" les disques Toshiba ont un bruit de têtes supérieur au bruit des Seagate et WD, c'est donc un bruit "normal"
  • Bruit toutes les 5 secondes en idle: Western Digital a répondu officiellement sur son blog, qu'il s'agit là d'un bruit tout à fait normal, dû à une foncttionnalité utilisée pour éviter les accumulations de "lubrifiant" des axes en cas d'inutilisation prolongée. C'est une pratique courante chez les fabricants de disques durs pour assurer la fiabilité des disques. Le fonctionnement normal oblige généralement à lancer une opération "seek" au niveau du disque pendant les moments d'inactivité, de fait le son provoqué est plus perceptible puisque le disque est en idle (environ toutes les 5 secondes). Par ailleurs le fait de fixer directement le disque dur à un châssis métallique peut amplifier ce phénomène et rendre le disque dur plus audible lors de ces activations.

Les bruits à "éviter":

  • Bruit dû aux vibrations : un disque mal fixé ou bien dans une cage dont l'amortissement n'est pas idéal, va vibrer (mouvement de spin autour de l'axe moteur, induit par la vitesse de rotation élevée des disques, un peu comme un gyroscope). Ce bruit n'impacte pas immédiatement la vie du disque, cependant il caractérise un micro-mouvement du chassis vs. les têtes qui "flottent" à qql. millième de millimètres de la surface des plateaux ...
  • Bruit dû au parquage des têtes: une mauvaise gestion des paramètres de mise en veille peut entrainer un parquage prématuré des têtes, voir des bugs à répétitions, un bruit de "cloc-cloc" se fait entendre correspondant aux têtes qui parque et déparque ... A solutionner rapidement (eg. gestionnaire de mise en veille de l'OS etc.) car c'est un préliminaire à la panne ...

Les bruits "suspects": 

  • Bruit du bloc de tête: un bruit régulier de "tac-tac" durant les opérations de lecture/écriture indique des mouvements du bloc inappropriés pour différentes raisons (eg. secteurs HS, actuateur déficient etc.)
  • Bruit mécaniques: des bruits métalliques au repos indiquent très certainement que les plateaux/entraînement moteur ont un souçis

Pour aller plus loin, les attributs de monitoring du disque "SMART" sont un indicateur utile ...

Attributs S.M.A.R.T

S.M.A.R.T (Self-Monitoring, Analysis, and Reporting Technology) est un système de monitoring interne au disque, qui permet d'avoir des éléments de caractérisations de la santé de ce dernier, voir de prévenir des erreurs.

ATTENTION: la gestion des attributs n'est pas "standard", en ce sens voir des valeurs sur certains paramètres pour un constructeur n'aura pas la même signification que pour un autre ... voir entre des générations de disques différents d'un même constructeur ...

L'accès à ces attributs se fait de différentes manières: à l'aide de logiciels (eg. Crystal Disk Report, HDD Sentinel, Veronique ...), via le gestionnaire de disque des NAS (eg. Synology, QNAPS, Asustor, WD ...), ou via des commandes en lignes sous Linux (eg. smartctl).

La lecture de ces attributs et surtout leur surveillance historisée,  permettra d'anticiper une panne ... mais tous les attributs ne sont pas des indicateurs de panne ... le tableau ci-après reprend les indicateurs les plus communs et ceux à surveiller.

Attributs les plus communs, valeurs normales, et indicateurs de panne potentielle ...