Ingénieurs : en 2008, hurlement massif lors d’une chute soudaine de la vitesse des disques durs, les vidéos d’expériences redeviennent virales

工程師2008年大吼HDD

Une vidéo d’essais filmée en décembre 2008 dans un centre de données de Sun Microsystems a refait surface au début/milieu de juin et cumule désormais plus de 5,3 millions de vues. Le personnage principal de la vidéo, Brendan Gregg, crie en direction d’un ensemble de disques durs mécaniques JBOD (HDD) ; l’outil d’analyse Sun Fishworks indique que les valeurs de latence des HDD frappés par les ondes sonores bondissent simultanément sur la même seconde.

Carnet de tests de l’essai au centre de données de Sun Microsystems en 2008

Brendan Gregg對硬碟大吼 (Source : Youtube)

La vidéo a été mise en ligne par le collègue de Gregg, Bryan Cantrill, et a été enregistrée en décembre 2008. Le matériel de test est un JBOD (Just a Bunch of Disks, un ensemble de disques durs mécaniques connectés directement en série), et l’outil de surveillance est le système d’analyse Sun Fishworks, capable d’afficher en temps réel la latence de lecture/écriture de chaque HDD.

Les résultats de l’expérience sont visibles sans ambiguïté sur l’écran de surveillance : au moment où Gregg commence à crier, les valeurs de latence de certains HDD précis montent immédiatement en flèche, tandis que les vitesses de lecture/écriture chutent nettement ; une fois Gregg arrêté de crier, les valeurs de latence reviennent à la normale. L’écran de surveillance indique précisément quels disques sont affectés et dans quelle mesure.

Le mécanisme physique des têtes HDD qui se perdent : suspension à l’échelle nanométrique et transmission des ondes sonores

Les têtes de lecture/écriture des HDD flottent au-dessus des plateaux à seulement quelques nanomètres ; les plateaux tournent à grande vitesse, à plusieurs milliers de tours par minute. La marge de tolérance du système sur le plan physique est proche de zéro.

Lorsque les ondes sonores se propagent dans l’air jusqu’au châssis du HDD, puis sont transmises à l’intérieur via la structure du boîtier, cela provoque de minuscules déplacements relatifs entre le plateau et la tête. Comme la tête doit être positionnée avec une précision extrême pour lire/écrire sur les pistes magnétiques, tout décalage non prévu, même minime, déclenche une procédure de repositionnement, ce qui fait grimper la latence et baisser le débit. Les HDD de niveau centre de données sont bien dotés de conceptions anti-vibrations, mais des pics soudains de forte pression acoustique peuvent néanmoins franchir le seuil de protection.

CVE-2022-38392 : cas de résonance avec le single « Rhythm Nation » de Janet Jackson et des HDD 5400 RPM

Le single « Rhythm Nation », publié par Janet Jackson en 1989, a été découvert par des ingénieurs de Microsoft : à un certain passage, la fréquence de résonance naturelle coïncidait exactement avec la fréquence de résonance mécanique des HDD 5400 RPM portables dominants de l’époque. En diffusant cette chanson à proximité de certains ordinateurs portables, on peut faire s’effondrer l’HDD et provoquer un crash ; ce n’est pas seulement l’ordinateur qui diffuse la musique qui peut être affecté, mais aussi l’autre ordinateur portable placé à côté. Ce cas a été officiellement consigné en 2022 comme une faille de sécurité, CVE-2022-38392, devenant une entrée rare dans l’histoire de la sécurité logicielle et matérielle, dont la cause invoquée est une chanson populaire.

Déploiement actuel des HDD mécaniques dans les centres de données IA

Les SSD (disques à semi-conducteurs, sans pièces en rotation) sont presque totalement immunisés contre les ondes sonores et les vibrations ; leur pénétration dans les centres de données modernes a fortement augmenté. Toutefois, en raison de leurs coûts et de leur avantage en capacité, les HDD mécaniques restent largement déployés dans les scénarios de stockage à froid.

Les jeux de données bruts requis pour entraîner l’IA atteignent souvent des dizaines à des centaines de téraoctets ; une part considérable reste stockée sur des baies de disques mécaniques. Ainsi, « les ondes sonores font ralentir les HDD » n’est pas qu’une anecdote historique : c’est un risque potentiel de l’infrastructure en production.

Questions fréquentes

Pourquoi les HDD sont-ils aussi sensibles aux ondes sonores ?

D’après l’article, les têtes de lecture/écriture des HDD flottent au-dessus des plateaux à seulement quelques nanomètres ; la marge de tolérance physique de l’ensemble du système est proche de zéro. Les ondes sonores se transmettent à l’intérieur du HDD via l’air et la structure du boîtier, provoquant un déplacement relatif minuscule entre la tête et le plateau ; tout décalage déclenche alors une procédure de repositionnement, ce qui fait augmenter la latence. Il s’agit d’une limite structurelle des plateaux rotatifs mécaniques, dictée par les lois de la physique, et non d’un défaut de conception.

Comment CVE-2022-38392 est-elle devenue une faille de sécurité officielle ?

D’après l’article, des ingénieurs de Microsoft ont constaté que la fréquence spécifique de la chanson « Rhythm Nation » de Janet Jackson (sortie en 1989) coïncidait avec la fréquence de résonance mécanique des HDD portables 5400 RPM ; la lecture de la chanson peut alors provoquer la défaillance du HDD. Comme ce problème correspond à la définition d’une faille de sécurité (panne systémique déclenchable par des facteurs externes), il a été officiellement intégré à la base de données des vulnérabilités en 2022, sous le numéro CVE-2022-38392.

Y a-t-il encore un risque que des HDD soient affectés par les ondes sonores dans les centres de données IA ?

D’après l’article, bien que les SSD soient immunisés contre les ondes sonores, les HDD mécaniques restent largement utilisés pour le stockage à froid grâce à leurs coûts et à leurs avantages en capacité, et une part importante des jeux de données d’entraînement de l’IA est également stockée dans des baies de disques mécaniques. Par conséquent, le phénomène d’ondes sonores affectant les HDD demeure un risque potentiel de l’infrastructure en production, et n’est pas un simple événement historique.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire