HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence De Raisonnement Mathématique Omni-MATH

Date

il y a un an

Taille

2.41 MB

Organisation

Université de Pékin

URL de publication

omni-math.github.io

URL de l'article

arxiv.org

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

Omni-MATH est un ensemble de données de référence de raisonnement mathématique de niveau Olympiade créé par l'Université de Pékin et Alibaba, qui vise à évaluer les performances des grands modèles de langage (LLM) sur des problèmes mathématiques de niveau Olympiade. Les résultats pertinents de l'article sontOmni-MATH : une référence mathématique de niveau Olympiade universelle pour les grands modèles de langage".

Cet ensemble de données contient 4 428 problèmes mathématiques de niveau compétition rigoureusement annotés manuellement, couvrant 33 sous-domaines et plus de 10 niveaux de difficulté différents, du niveau préparatoire aux Olympiades aux meilleures compétitions mathématiques des Olympiades telles que l'IMO (International Mathematical Olympiad), l'IMC (International Mathematical Contest) et le Putnam Mathematics Competition.

Le processus de création d'Omni-MATH comprend la collecte de données provenant de compétitions mondiales de mathématiques et leur vérification par annotation humaine pour garantir la haute qualité et la diversité des données. Lors de la construction de l’ensemble de données, l’équipe de recherche a utilisé GPT-4o pour classer les questions et les diviser en différents domaines mathématiques afin d’évaluer les performances du modèle dans différents domaines mathématiques.

Omni-MATH.torrent
Partage 1Téléchargement 0Terminés 121Téléchargements totaux 187
  • Omni-MATH/
    • README.md
      1.73 KB
    • README.txt
      3.46 KB
      • data/
        • omnimath.zip
          2.41 MB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Référence De Raisonnement Mathématique Omni-MATH | Ensembles de données | HyperAI