Ensemble De Données De Référence Multilingue Et Multitâche P-MMEval

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Commencer Voir les tarifs

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 2 ans

Taille

12.72 MB

Organisation

URL du document

arxiv.org

Balises

Benchmarks

Citation

@misc{zhang2024pmmevalparallelmultilingualmultitask,
title={P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs},
author={Yidan Zhang and Yu Wan and Boyi Deng and Baosong Yang and Haoran Wei and Fei Huang and Bowen Yu and Junyang Lin and Fei Huang and Jingren Zhou},
year={2024},
eprint={2411.09116},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2411.09116},
}

P-MMEval.torrent

Partage 1Téléchargement 0Terminé 173Total des téléchargements 241

P-MMEval/
- README.md
  1.48 KB
- README.txt
  2.97 KB

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 9 heures

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

il y a 5 jours

Base De Données De Connaissances TACK Targeted Chimera

il y a 22 jours

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 13 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO