HyperAIHyperAI

Command Palette

Search for a command to run...

P-MMEval Mehrsprachiger Multitasking-Benchmark-Datensatz

Date

vor einem Jahr

Size

12.72 MB

Organization

Paper URL

arxiv.org

Der P-MMEval-Datensatz ist ein umfangreicher mehrsprachiger Multitasking-Benchmark-Datensatz, der 2024 vom Tongyi Laboratory der Alibaba Group erstellt wurde und darauf abzielt, die mehrsprachigen Fähigkeiten großer Sprachmodelle (LLMs) umfassend zu bewerten. Die relevanten Papierergebnisse sindP-MMEVAL: Ein paralleler mehrsprachiger Multitasking-Benchmark zur konsistenten Bewertung von LLMs"

Der Datensatz enthält 3 grundlegende Datensätze zur Verarbeitung natürlicher Sprache (NLP) und 5 erweiterte fähigkeitsspezifische Datensätze, die Aufgaben wie Codegenerierung, Wissensverständnis, mathematisches Denken, logisches Denken und Befolgen von Anweisungen abdecken. Durch die Überprüfung der Übersetzungen durch Experten gewährleistet P-MMEval eine konsistente Abdeckung der 10 Sprachen und bietet parallele Beispiele für alle Sprachen. Zu diesen Sprachen gehören Englisch, Chinesisch, Arabisch, Spanisch, Japanisch, Koreanisch, Thailändisch, Französisch, Portugiesisch und Vietnamesisch.

P-MMEval.torrent
Seeding 1Downloading 0Completed 120Total Downloads 202
  • P-MMEval/
    • README.md
      1.48 KB
    • README.txt
      2.97 KB
      • data/
        • P-MMEval.zip
          12.72 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp