HyperAI

Ensemble De Données De Compréhension Du Langage Multilingue Et Multitâche MMMLU

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

L'ensemble de données Multilingual Massive Multi-Task Language Understanding (MMMLU) est un ensemble de données open source lancé par OpenAI en 2024, qui vise à évaluer et à améliorer les performances des modèles d'intelligence artificielle dans différents contextes linguistiques, cognitifs et culturels. Construit sur le benchmark Massive Multi-Task Language Understanding (MMLU), MMMLU est une mesure de bon sens obtenue par des modèles d'IA qui comprend des tâches de 57 domaines différents, allant des connaissances élémentaires aux disciplines professionnelles avancées telles que le droit, la physique, l'histoire et l'informatique.

L'équipe de recherche a fait appel à des traducteurs professionnels pour traduire l'ensemble de tests de MMLU en 14 langues. Le recours à des traductions humaines pour cette évaluation peut renforcer la confiance dans l’exactitude des traductions, en particulier pour les langues à faibles ressources comme le yoruba. En faisant appel à des traducteurs professionnels pour effectuer la traduction, MMMLU peut garantir l’exactitude et la fiabilité de l’ensemble de données, ce qui est essentiel pour évaluer les capacités des modèles d’IA dans les tâches multilingues.

Les principales fonctions du MMMLU comprennent l’évaluation multilingue, les tests de compétence multitâches, la compréhension interculturelle, l’amélioration de la diversité des modèles et le soutien à la recherche et au développement. Les principes techniques incluent la construction d’ensembles de données, la traduction professionnelle, le support multilingue, le développement d’outils d’évaluation et l’analyse des performances.

Les scénarios d'application de MMMLU incluent l'évaluation des modèles linguistiques, les systèmes de traduction automatique, la communication interculturelle, la technologie éducative et les affaires internationales. La publication de l’ensemble de données aura un impact considérable sur le domaine de la recherche en traitement du langage naturel (TALN). MMMLU fournit un soutien important en matière de ressources pour l'exploration théorique et le développement d'applications pratiques.

MMMLU.torrent
Partage 2Téléchargement 0Terminés 63Téléchargements totaux 201
  • MMMLU/
    • README.md
      2.19 KB
    • README.txt
      4.38 KB
      • data/
        • MMMLU.zip
          31.05 MB