HyperAIHyperAI

Command Palette

Search for a command to run...

Cartographie des Mèmes aux Mots pour la Classification Multimodale des Mèmes Haineux

Giovanni Burbi Alberto Baldrati Lorenzo Agnolucci Marco Bertini Alberto Del Bimbo

Résumé

Les mémos multimodaux image-texte sont omniprésents sur Internet, servant de forme unique de communication qui combine des éléments visuels et textuels pour transmettre l'humour, les idées ou les émotions. Cependant, certains mémos prennent une tournure malveillante, en promouvant du contenu haineux et en perpétuant la discrimination. La détection de ces mémos haineux dans ce contexte multimodal est une tâche complexe qui nécessite une compréhension de la signification entremêlée du texte et des images. Dans cette étude, nous abordons cette problématique en proposant une nouvelle approche nommée ISSUES pour la classification des mémos haineux multimodaux. ISSUES utilise un modèle pré-entraîné CLIP (vision-langage) et la technique d'inversion textuelle pour capturer efficacement le contenu sémantique multimodal des mémos. Les expériences montrent que notre méthode obtient des résultats à l'état de l'art sur les jeux de données Hateful Memes Challenge et HarMeme. Le code source et les modèles pré-entraînés sont librement accessibles à l'adresse suivante : https://github.com/miccunifi/ISSUES.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Cartographie des Mèmes aux Mots pour la Classification Multimodale des Mèmes Haineux | Articles | HyperAI