HyperAIHyperAI

Command Palette

Search for a command to run...

MMMLU Mehrsprachiger Multitasking-Sprachverständnisdatensatz

Datum

vor einem Jahr

Größe

31.05 MB

Organisation

OpenAI

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der Multilingual Massive Multi-Task Language Understanding (MMMLU)-Datensatz ist ein Open-Source-Datensatz, der 2024 von OpenAI veröffentlicht wurde und darauf abzielt, die Leistung von Modellen künstlicher Intelligenz in verschiedenen sprachlichen, kognitiven und kulturellen Kontexten zu bewerten und zu verbessern. MMMLU basiert auf dem Benchmark „Massive Multi-Task Language Understanding“ (MMLU) und ist eine von KI-Modellen erreichte Common-Sense-Metrik, die Aufgaben aus 57 verschiedenen Themenbereichen umfasst, die von elementarem Wissen bis hin zu fortgeschrittenen Fachdisziplinen wie Recht, Physik, Geschichte und Informatik reichen.

Das Forschungsteam setzte professionelle menschliche Übersetzer ein, um den MMLU-Testsatz in 14 Sprachen zu übersetzen. Wenn man sich bei dieser Bewertung auf menschliche Übersetzer verlässt, erhöht sich das Vertrauen in die Genauigkeit der Übersetzungen, insbesondere bei ressourcenarmen Sprachen wie Yoruba. Indem MMMLU die Übersetzung von professionellen Übersetzern durchführen lässt, kann das Unternehmen die Genauigkeit und Zuverlässigkeit des Datensatzes sicherstellen, was für die Bewertung der Fähigkeiten von KI-Modellen bei sprachübergreifenden Aufgaben von entscheidender Bedeutung ist.

Zu den Hauptfunktionen von MMMLU gehören die mehrsprachige Beurteilung, das Testen der Multitasking-Fähigkeit, das interkulturelle Verständnis, die Verbesserung der Modellvielfalt sowie die Unterstützung von Forschung und Entwicklung. Zu den technischen Prinzipien gehören die Erstellung von Datensätzen, professionelle Übersetzung, Unterstützung mehrerer Sprachen, Entwicklung von Auswertungstools und Leistungsanalyse.

Zu den Anwendungsszenarien von MMMLU gehören die Bewertung von Sprachmodellen, maschinelle Übersetzungssysteme, interkulturelle Kommunikation, Bildungstechnologie und internationales Geschäft. Die Veröffentlichung des Datensatzes wird weitreichende Auswirkungen auf den Bereich der Forschung zur Verarbeitung natürlicher Sprache (NLP) haben. MMMLU bietet wichtige Ressourcenunterstützung sowohl für die theoretische Erforschung als auch für die Entwicklung praktischer Anwendungen.

MMMLU.torrent
Seeding 1Herunterladen 0Abgeschlossen 213Gesamtdownloads 368
  • MMMLU/
    • README.md
      2.19 KB
    • README.txt
      4.38 KB
      • data/
        • MMMLU.zip
          31.05 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp