@inproceedings{moroni-etal-2025-multi, title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?", author = "Moroni, Luca and Aula-Blasco, Javier and Conia, Simone and Baucells, Irene and Perez, Naiara and Su{\'a}rez, Silvia Paniagua and Sall{\'e}s, Anna and Ostendorff, Malte and Falc{\~a}o, J{\'u}lia and Son, Guijin and Gonzalez-Agirre, Aitor and Navigli, Roberto and Villegas, Marta", editor = "Christodoulopoulos, Christos and Chakraborty, Tanmoy and Rose, Carolyn and Peng, Violet", booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2025", address = "Suzhou, China", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2025.emnlp-main.1731/", doi = "10.18653/v1/2025.emnlp-main.1731", pages = "34114--34145", ISBN = "979-8-89176-332-6" }

Datum

vor 8 Monaten

Lizenz

CC BY-SA 4.0

Datensatzstruktur

Der Datensatz ist nach Sprachen in Ordnern organisiert.
In jedem Sprachordner entspricht jede Aufgabe einer JSON-Datei.
Jede JSON-Datei enthält Eingabehinweise und die erwarteten Ausgaben für die Aufgabe.
Zu den Aufgabentypen gehören einfacher Satzbau, kontextbezogene Wortschatzauswahl und logisches Schlussfolgern über Buchstaben.
Manche Aufgaben sind sprachspezifisch; so sind beispielsweise Reimaufgaben in Sprachen ausgeschlossen, in denen sie nicht anwendbar sind.

Zitat

@inproceedings{moroni-etal-2025-multi,
title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?",
author = "Moroni, Luca  and
Aula-Blasco, Javier  and
Conia, Simone  and
Baucells, Irene  and
Perez, Naiara  and
Su{\'a}rez, Silvia Paniagua  and
Sall{\'e}s, Anna  and
Ostendorff, Malte  and
Falc{\~a}o, J{\'u}lia  and
Son, Guijin  and
Gonzalez-Agirre, Aitor  and
Navigli, Roberto  and
Villegas, Marta",
editor = "Christodoulopoulos, Christos  and
Chakraborty, Tanmoy  and
Rose, Carolyn  and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.1731/",
doi = "10.18653/v1/2025.emnlp-main.1731",
pages = "34114--34145",
ISBN = "979-8-89176-332-6"
}

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 8 Monaten

Lizenz

CC BY-SA 4.0

Datensatzstruktur

Der Datensatz ist nach Sprachen in Ordnern organisiert.
In jedem Sprachordner entspricht jede Aufgabe einer JSON-Datei.
Jede JSON-Datei enthält Eingabehinweise und die erwarteten Ausgaben für die Aufgabe.
Zu den Aufgabentypen gehören einfacher Satzbau, kontextbezogene Wortschatzauswahl und logisches Schlussfolgern über Buchstaben.
Manche Aufgaben sind sprachspezifisch; so sind beispielsweise Reimaufgaben in Sprachen ausgeschlossen, in denen sie nicht anwendbar sind.

Zitat

@inproceedings{moroni-etal-2025-multi,
title = "Multi-{LM}entry: Can Multilingual {LLM}s Solve Elementary Tasks Across Languages?",
author = "Moroni, Luca  and
Aula-Blasco, Javier  and
Conia, Simone  and
Baucells, Irene  and
Perez, Naiara  and
Su{\'a}rez, Silvia Paniagua  and
Sall{\'e}s, Anna  and
Ostendorff, Malte  and
Falc{\~a}o, J{\'u}lia  and
Son, Guijin  and
Gonzalez-Agirre, Aitor  and
Navigli, Roberto  and
Villegas, Marta",
editor = "Christodoulopoulos, Christos  and
Chakraborty, Tanmoy  and
Rose, Carolyn  and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.1731/",
doi = "10.18653/v1/2025.emnlp-main.1731",
pages = "34114--34145",
ISBN = "979-8-89176-332-6"
}

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

vor 35 Minuten

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

vor 20 Stunden

Verrauschter Datensatz Medizinischer Dokumentenbilder

vor einem Tag

OpenSAL360 Panorama-Video-Saliency-Datensatz

vor 18 Tagen

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

vor 18 Tagen

SMOL Multilingual Translation Parallel Dataset

vor 19 Tagen

Datensatz Zur Erkennung Medizinischer Abfälle

vor einem Monat

Brustkrebs: Multimodaler Fusionsdatensatz

vor einem Monat

MDPBench Multilingual Document Parsing Benchmark Dataset

vor einem Tag

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Multi-LMentry Multilingual Basic Task Benchmark Dataset

Datensatzstruktur

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Multi-LMentry Multilingual Basic Task Benchmark Dataset

Datensatzstruktur

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

Verrauschter Datensatz Medizinischer Dokumentenbilder

OpenSAL360 Panorama-Video-Saliency-Datensatz

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

Datensatz Zur Erkennung Medizinischer Abfälle

Brustkrebs: Multimodaler Fusionsdatensatz

MDPBench Multilingual Document Parsing Benchmark Dataset

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Multi-LMentry Multilingual Basic Task Benchmark Dataset

Datensatzstruktur

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

Verrauschter Datensatz Medizinischer Dokumentenbilder

OpenSAL360 Panorama-Video-Saliency-Datensatz

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

Datensatz Zur Erkennung Medizinischer Abfälle

Brustkrebs: Multimodaler Fusionsdatensatz

MDPBench Multilingual Document Parsing Benchmark Dataset

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

Verrauschter Datensatz Medizinischer Dokumentenbilder

OpenSAL360 Panorama-Video-Saliency-Datensatz

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

Datensatz Zur Erkennung Medizinischer Abfälle

Brustkrebs: Multimodaler Fusionsdatensatz

MDPBench Multilingual Document Parsing Benchmark Dataset

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

Verrauschter Datensatz Medizinischer Dokumentenbilder

OpenSAL360 Panorama-Video-Saliency-Datensatz

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

Datensatz Zur Erkennung Medizinischer Abfälle

Brustkrebs: Multimodaler Fusionsdatensatz

MDPBench Multilingual Document Parsing Benchmark Dataset

DRACO Cross-Domain Deep Research Benchmark-Datensatz