@inproceedings{moroni-etal-2025-multi, title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?", author = "Moroni, Luca and Aula-Blasco, Javier and Conia, Simone and Baucells, Irene and Perez, Naiara and Su{\'a}rez, Silvia Paniagua and Sall{\'e}s, Anna and Ostendorff, Malte and Falc{\~a}o, J{\'u}lia and Son, Guijin and Gonzalez-Agirre, Aitor and Navigli, Roberto and Villegas, Marta", editor = "Christodoulopoulos, Christos and Chakraborty, Tanmoy and Rose, Carolyn and Peng, Violet", booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2025", address = "Suzhou, China", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2025.emnlp-main.1731/", doi = "10.18653/v1/2025.emnlp-main.1731", pages = "34114--34145", ISBN = "979-8-89176-332-6" }

Date

il y a 8 mois

Licence

CC BY-SA 4.0

Balises

Traitement Du Langage Naturel

Multi-LMentry est un ensemble de données de référence multilingue publié en 2025, conçu pour évaluer systématiquement la capacité de généralisation interlingue des grands modèles de langage (LLM) pour la compréhension du langage de bas niveau et les tâches de raisonnement de base dans des environnements multilingues. Cet ensemble de données couvre neuf langues : anglais, catalan, allemand, espagnol, basque, galicien, coréen, italien et portugais brésilien. Les tâches ont été reformulées manuellement par des locuteurs natifs, dans une forme similaire à celle du cadre LMentry original, mais sans traduction directe, afin de garantir un rendu naturel et une adéquation culturelle.

Structure du jeu de données

L'ensemble de données est organisé en dossiers par langue.
Dans chaque dossier de langue, chaque tâche correspond à un fichier JSON.
Chaque fichier JSON contient des indications sur les entrées et les sorties attendues pour la tâche.
Les types de tâches comprennent la construction de phrases simples, la sélection de vocabulaire contextuel et le raisonnement à partir de lettres.
Certaines tâches sont spécifiques à une langue ; par exemple, les tâches de rimes sont exclues dans les langues où elles ne sont pas applicables.

Citation

@inproceedings{moroni-etal-2025-multi,
title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?",
author = "Moroni, Luca  and
Aula-Blasco, Javier  and
Conia, Simone  and
Baucells, Irene  and
Perez, Naiara  and
Su{\'a}rez, Silvia Paniagua  and
Sall{\'e}s, Anna  and
Ostendorff, Malte  and
Falc{\~a}o, J{\'u}lia  and
Son, Guijin  and
Gonzalez-Agirre, Aitor  and
Navigli, Roberto  and
Villegas, Marta",
editor = "Christodoulopoulos, Christos  and
Chakraborty, Tanmoy  and
Rose, Carolyn  and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.1731/",
doi = "10.18653/v1/2025.emnlp-main.1731",
pages = "34114--34145",
ISBN = "979-8-89176-332-6"
}

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 3 heures

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a 18 jours

Ensemble De Données Parallèles De Traduction Multilingue SMOL

il y a 19 jours

Ensemble De Données Sur La Détection Des Déchets Médicaux

il y a un mois

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

il y a un mois

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a un jour

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 8 mois

Licence

CC BY-SA 4.0

Balises

Traitement Du Langage Naturel

Structure du jeu de données

L'ensemble de données est organisé en dossiers par langue.
Dans chaque dossier de langue, chaque tâche correspond à un fichier JSON.
Chaque fichier JSON contient des indications sur les entrées et les sorties attendues pour la tâche.
Les types de tâches comprennent la construction de phrases simples, la sélection de vocabulaire contextuel et le raisonnement à partir de lettres.
Certaines tâches sont spécifiques à une langue ; par exemple, les tâches de rimes sont exclues dans les langues où elles ne sont pas applicables.

Citation

@inproceedings{moroni-etal-2025-multi,
title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?",
author = "Moroni, Luca  and
Aula-Blasco, Javier  and
Conia, Simone  and
Baucells, Irene  and
Perez, Naiara  and
Su{\'a}rez, Silvia Paniagua  and
Sall{\'e}s, Anna  and
Ostendorff, Malte  and
Falc{\~a}o, J{\'u}lia  and
Son, Guijin  and
Gonzalez-Agirre, Aitor  and
Navigli, Roberto  and
Villegas, Marta",
editor = "Christodoulopoulos, Christos  and
Chakraborty, Tanmoy  and
Rose, Carolyn  and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.1731/",
doi = "10.18653/v1/2025.emnlp-main.1731",
pages = "34114--34145",
ISBN = "979-8-89176-332-6"
}

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 3 heures

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

il y a un jour

Ensemble De Données d'images De Documents Médicaux Bruitées

il y a un jour

Ensemble De Données De Saillance Vidéo Panoramique OpenSAL360

il y a 18 jours

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a 18 jours

Ensemble De Données Parallèles De Traduction Multilingue SMOL

il y a 19 jours

Ensemble De Données Sur La Détection Des Déchets Médicaux

il y a un mois

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

il y a un mois

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a un jour

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence Pour Les Tâches De Base Multilingues Multi-LMentry

Structure du jeu de données

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour Les Tâches De Base Multilingues Multi-LMentry

Structure du jeu de données

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

Ensemble De Données d'images De Documents Médicaux Bruitées

Ensemble De Données De Saillance Vidéo Panoramique OpenSAL360

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour Les Tâches De Base Multilingues Multi-LMentry

Structure du jeu de données

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

Ensemble De Données d'images De Documents Médicaux Bruitées

Ensemble De Données De Saillance Vidéo Panoramique OpenSAL360

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

Ensemble De Données d'images De Documents Médicaux Bruitées

Ensemble De Données De Saillance Vidéo Panoramique OpenSAL360

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

Ensemble De Données d'images De Documents Médicaux Bruitées

Ensemble De Données De Saillance Vidéo Panoramique OpenSAL360

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO