Google lance un programme de récompenses jusqu’à 30 000 $ pour dénoncer les failles critiques dans ses produits d’IA
Google a lancé un nouveau programme de récompenses dédié à la détection de bugs dans ses produits d’intelligence artificielle, offrant jusqu’à 30 000 dollars aux chercheurs en sécurité. Ce programme, mis en place lundi, vise à identifier des failles critiques dans les systèmes d’IA générative, notamment celles qui permettent des actions malveillantes indirectes. Parmi les exemples cités par Google figurent des injections de prompts capables de faire déverrouiller une porte via Google Home, ou des attaques par injection de prompt qui extraient et transmettent en secret des données sensibles, comme un résumé de toutes les e-mails d’un utilisateur envoyé à un compte attaquant. Le programme précise ce qu’il considère comme un « bug d’IA » : toute vulnérabilité exploitée à l’aide d’un modèle de langage à grande échelle ou d’un système d’IA générative pour causer un préjudice, en tirant parti d’un point faible de sécurité. Les cas les plus graves incluent la modification non autorisée de comptes ou de données, comme une faille précédemment révélée permettant d’ouvrir des volets intelligents ou d’éteindre les lumières via un événement malveillant dans Google Calendar. Toutefois, Google précise que les simples hallucinations du modèle, c’est-à-dire des contenus inventés ou erronés par Gemini, ne sont pas éligibles à cette récompense. Les problèmes liés à la génération de contenu problématique — comme du discours haineux ou des contenus protégés par des droits d’auteur — doivent être signalés via le canal de feedback intégré aux produits, afin que les équipes de sécurité de l’IA puissent analyser le comportement du modèle et mettre en œuvre des correctifs de sécurité à long terme, via une formation renforcée du modèle. Parallèlement au programme de récompenses, Google a annoncé l’arrivée d’un nouvel agent d’IA baptisé CodeMender, conçu pour corriger automatiquement des vulnérabilités dans le code open source. Après vérification par des chercheurs humains, cet outil a déjà permis de corriger 72 failles dans des projets open source. Le prix principal de 20 000 dollars est attribué aux bugs critiques détectés sur les produits phares de Google : Search, les applications Gemini, ainsi que les composants clés de Workspace comme Gmail et Drive. Des bonus pour la qualité du rapport et la nouveauté de la découverte peuvent faire monter le montant total jusqu’à 30 000 dollars. Pour les failles identifiées sur d’autres produits comme Jules ou NotebookLM, ou pour des abus moins graves — par exemple le vol de paramètres secrets du modèle — les récompenses sont plus faibles.