il y a 2 mois

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

Les avancées récentes dans les grands modèles linguistiques ont stimulé le développement de modèles linguistiques multimodaux (MLLMs), intégrant le texte, la parole et la vision dans des cadres unifiés. Alors que les MLLMs évoluent de systèmes spécialisés, monolingues et à tâches spécifiques vers des modèles polyvalents capables de suivre des instructions, une frontière clé réside dans l’évaluation de leurs capacités multilingues et multimodales, tant sur des contextes courts que longs. Toutefois, les benchmarks existants peinent à évaluer conjointement ces dimensions : ils sont souvent limités à l’anglais, se concentrent principalement sur une seule modalité à la fois, reposent sur des contextes courts, ou manquent d’annotations humaines — ce qui entrave une évaluation complète de la performance des modèles selon les langues, les modalités et la complexité des tâches. Pour combler ces lacunes, nous introduisons MCIF (Multimodal Crosslingual Instruction Following), le premier benchmark multilingue annoté par des humains fondé sur des conférences scientifiques, conçu pour évaluer le suivi d'instructions dans des contextes multilingues et multimodaux, tant pour des entrées courtes que longues. MCIF couvre trois modalités fondamentales — parole, vision et texte — et quatre langues diverses (anglais, allemand, italien et chinois), permettant ainsi une évaluation complète des capacités des MLLMs à interpréter des instructions dans différentes langues et à les combiner avec des informations contextuelles multimodales. MCIF est mis à disposition sous licence CC-BY 4.0 afin de favoriser la recherche ouverte et l’avancement du développement des MLLMs.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

MCIF : Benchmark de suivi d'instructions multimodal et multilingue issu de conférences scientifiques

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MCIF : Benchmark de suivi d'instructions multimodal et multilingue issu de conférences scientifiques

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MCIF : Benchmark de suivi d'instructions multimodal et multilingue issu de conférences scientifiques

Sara Papi Maike Züfle Marco Gaido Beatrice Savoldi Danni Liu Ioannis Douros Luisa Bentivogli Jan Niehues

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters