AUTOHALLUSION : Génération automatique de benchmarks d'hallucination pour les modèles vision-langue

Les grands modèles de vision-langue (LVLM) hallucinent : certains indices contextuels dans une image peuvent déclencher un raisonnement excessivement confiant et erroné du module linguistique sur des objets anormaux ou hypothétiques. Bien que quelques benchmarks aient été développés pour étudier les hallucinations des LVLM, ils reposent principalement sur des cas particuliers conçus manuellement, dont les schémas d'échec peuvent à peine être généralisés, et l'ajustement fin sur ces cas peut compromettre leur validité. Ces constatations nous motivent à développer la première approche de génération automatique de benchmarks, AUTOHALLUSION, qui utilise plusieurs stratégies clés pour créer des exemples variés d'hallucinations. Elle explore les modules linguistiques des LVLM pour identifier les indices contextuels et les utilise pour synthétiser des images en : (1) ajoutant des objets anormaux par rapport aux indices contextuels ; (2) pour deux objets co-occurrents, en conservant l'un et en excluant l'autre ; ou (3) en supprimant des objets étroitement liés aux indices contextuels. Elle génère ensuite des questions basées sur ces images dont les réponses véritables contredisent le préjugé initial du module linguistique. Un modèle doit surmonter les biais et les distractions contextuelles pour fournir des réponses correctes, tandis que des réponses incorrectes ou incohérentes indiquent des hallucinations. AUTOHALLUSION nous permet de créer de nouveaux benchmarks au coût minimal et ainsi de surmonter la fragilité des benchmarks conçus manuellement. Elle révèle également les schémas d'échec courants et leurs raisons, offrant des pistes essentielles pour détecter, éviter ou contrôler les hallucinations. Des évaluations exhaustives de modèles de premier plan tels que GPT-4V(ision), Gemini Pro Vision, Claude 3 et LLaVA-1.5 montrent un taux de succès de 97,7 % et 98,7 % dans l'induction d'hallucinations sur des jeux de données synthétiques et réels générés par AUTOHALLUSION, ouvrant ainsi la voie à une lutte prolongée contre les hallucinations.