HyperAI
Back to Headlines

Nouvelle attaque GPUHammer : Corruption silencieuse des modèles AI sur les cartes Nvidia GDDR6

il y a 2 jours

Nouvelle Attaque Rowhammer : Le "GPUHammer" Corrompt Silencieusement les Modèles d'IA sur les Cartes NVIDIA avec mémoire GDDR6 Le 25 octobre 2023, une équipe de chercheurs de l'Université de Toronto a révélé une nouvelle attaque nommée GPUHammer. Cette méthode permet de manipuler silencieusement les modèles d'intelligence artificielle (IA) en altérant un seul bit de la mémoire des cartes graphiques NVIDIA, entraînant des dégâts majeurs sans jamais toucher au code ou aux données d'entrée. Bien que NVIDIA ait déjà pris des mesures pour atténuer ce risque, il est important d'être vigilant, particulièrement si vous utilisez des cartes dotées de mémoire GDDR6. Qu'est-ce que GPUHammer ? L'attaque GPUHammer est une version ciblant les processeurs graphiques (GPU) d'un problème de sécurité matérielle connu sous le nom de Rowhammer. Ce phénomène affecte habituellement les puces de mémoire moderne (RAM et CPU), où la lecture ou l'écriture répétitives d'une ligne de cellules de mémoire provoquent des interférences électriques, invertissant les valeurs binaires (bits) des lignes adjacentes. L'inversion d'un bit peut perturber n'importe quoi, qu'il s'agisse de nombres, de commandes ou de paramètres d'un réseau neuronal. Jusque-là, le Rowhammer était surtout préoccupant pour les modules de mémoire DDR4 des systèmes, mais GPUHammer prouve que le même problème peut survenir sur les mémoires GDDR6 des VRAM (mémoire vidéo) modernes. Les chercheurs ont montré l'efficacité de cette attaque sur une vraie carte NVIDIA RTX A6000, réduisant l'exactitude d'un modèle d'IA de 80% à moins de 1%. Ils ont utilisé une technique consistant à solliciter fortement les cellules de mémoire jusqu'à ce qu'un bit voisin change, compromettant ainsi l'intégrité des données stockées. Risques et Impact Cette attaque ne nécessite pas d'accès direct aux données de l'utilisateur. Un attaquant n'a besoin que de partager le même GPU dans un environnement cloud ou serveur pour pouvoir altérer silencieusement les charges de travail des autres utilisateurs. Cela pose des risques considérables, notamment dans les domaines réglementés comme la santé, la finance et la conduite autonome, où la mauvaise décision d'un modèle d'IA peut entraîner des problèmes de sécurité, juridiques ou même physiques. Les tests ont révélé que GPUHammer pouvait provoquer plusieurs inversions de bits sur plusieurs banques de mémoire, complètement détruisant un modèle d'IA entrainé. Ces inversions sont presque invisibles sauf si on sait exactement où chercher, ce qui rend l'attaque difficile à détecter. Cartes Graphiques Concernées L'attaque a été testée sur une carte RTX A6000, mais elle concerne un large éventail de modèles de GPUs basés sur les architectures Ampere, Ada, Hopper et Turing, particulièrement ceux utilisés dans les stations de travail et les serveurs. NVIDIA a publié une liste complète des modèles affectés et recommande d'activer le Correcteur d'Erreurs à Code Étendu (ECC) pour la plupart d'entre eux. Les modèles plus récents, tels que l'RTX 5090 et l'H100, disposent de l'ECC intégré, éliminant ainsi la nécessité d'une configuration supplémentaire par l'utilisateur. Recommandations de NVIDIA NVIDIA a réagi swiftly en conseillant aux utilisateurs de activer l'ECC si leur GPU le supporte. L'ECC est une fonction qui ajoute une redondance à la mémoire afin de détecter et corriger les erreurs, telles que les inversions de bits provoquées par des attaques GPUHammer. Cependant, l'activation de cette fonction peut entraîner un léger ralentissement des performances, de l'ordre de 10% pour les tâches d'apprentissage automatique, et une perte d'environ 6-6.5% de la VRAM disponible. Pour activer l'ECC, vous pouvez utiliser la commande suivante en ligne de commande : nvidia-smi -e 1 Pour vérifier si l'ECC est activé, utilisez la commande : nvidia-smi -q | grep ECC Contexte Industriel Bien que la majorité des utilisateurs individuels, tels que les gamers et les utilisateurs de PC domestiques, ne soient pas directement visés par cette attaque, elle représente un appel à l'attention significatif. À mesure que les GPU continuent de s'évoluer au-delà du domaine du jeu pour inclure l'IA, le travail créatif et la productivité, les risques associés à la sécurité de la mémoire deviennent de plus en plus importants. GPUHammer montre que la sécurité de la mémoire doit être une priorité, même sur les GPUs. Des professionnels de l'industrie ont souligné que cette révélation force les fabricants et les développeurs à repenser leurs approches de sécurité matérielle. NVIDIA, reconnue pour ses GPU performants, doit maintenant également se positionner en leader en matière de sécurité mémoire, intégrant des correcteurs d'erreurs automatisés dans ses prochaines générations de cartes. En conclusion, GPUHammer est une attaque sérieuse qui souligne l'importance croissante de la sécurité matérielle dans l'ère de l'IA. NVIDIA a pris des mesures rapides pour y répondre, mais la vigilance reste de mise dans les environnements partagés.

Related Links