HyperAI

MMMLU Mehrsprachiger Multitasking-Sprachverständnisdatensatz

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der Multilingual Massive Multi-Task Language Understanding (MMMLU)-Datensatz ist ein Open-Source-Datensatz, der 2024 von OpenAI veröffentlicht wurde und darauf abzielt, die Leistung von Modellen künstlicher Intelligenz in verschiedenen sprachlichen, kognitiven und kulturellen Kontexten zu bewerten und zu verbessern. MMMLU basiert auf dem Benchmark „Massive Multi-Task Language Understanding“ (MMLU) und ist eine von KI-Modellen erreichte Common-Sense-Metrik, die Aufgaben aus 57 verschiedenen Themenbereichen umfasst, die von elementarem Wissen bis hin zu fortgeschrittenen Fachdisziplinen wie Recht, Physik, Geschichte und Informatik reichen.

Das Forschungsteam setzte professionelle menschliche Übersetzer ein, um den MMLU-Testsatz in 14 Sprachen zu übersetzen. Wenn man sich bei dieser Bewertung auf menschliche Übersetzer verlässt, erhöht sich das Vertrauen in die Genauigkeit der Übersetzungen, insbesondere bei ressourcenarmen Sprachen wie Yoruba. Indem MMMLU die Übersetzung von professionellen Übersetzern durchführen lässt, kann das Unternehmen die Genauigkeit und Zuverlässigkeit des Datensatzes sicherstellen, was für die Bewertung der Fähigkeiten von KI-Modellen bei sprachübergreifenden Aufgaben von entscheidender Bedeutung ist.

Zu den Hauptfunktionen von MMMLU gehören die mehrsprachige Beurteilung, das Testen der Multitasking-Fähigkeit, das interkulturelle Verständnis, die Verbesserung der Modellvielfalt sowie die Unterstützung von Forschung und Entwicklung. Zu den technischen Prinzipien gehören die Erstellung von Datensätzen, professionelle Übersetzung, Unterstützung mehrerer Sprachen, Entwicklung von Auswertungstools und Leistungsanalyse.

Zu den Anwendungsszenarien von MMMLU gehören die Bewertung von Sprachmodellen, maschinelle Übersetzungssysteme, interkulturelle Kommunikation, Bildungstechnologie und internationales Geschäft. Die Veröffentlichung des Datensatzes wird weitreichende Auswirkungen auf den Bereich der Forschung zur Verarbeitung natürlicher Sprache (NLP) haben. MMMLU bietet wichtige Ressourcenunterstützung sowohl für die theoretische Erforschung als auch für die Entwicklung praktischer Anwendungen.

MMMLU.torrent
Seeding 2Herunterladen 0Abgeschlossen 69Gesamtdownloads 208
  • MMMLU/
    • README.md
      2.19 KB
    • README.txt
      4.38 KB
      • data/
        • MMMLU.zip
          31.05 MB