Command Palette
Search for a command to run...
Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench
Date
URL du document
Licence
Apache 2.0
OmniParsingBench est un jeu de données de référence publié par Alibaba en 2026 pour évaluer les capacités d'analyse syntaxique unifiée des grands modèles multimodaux (MLLM). Parmi les articles de recherche associés, on peut citer… Rapport technique Logics-Parsing-OmniElle vise à dépasser les limites de l'évaluation traditionnelle à tâche unique, à évaluer systématiquement les capacités du modèle tout au long du processus, de la perception à la cognition, et est largement utilisée dans des scénarios tels que la compréhension multimodale, l'extraction d'informations structurées et la recherche sur les capacités de raisonnement complexes. Cet ensemble de données contient environ 5 294 échantillons, couvrant six modalités (images naturelles, graphiques, documents, audio, vidéo naturelle et vidéo riche en texte), et introduit trois niveaux de métriques d'évaluation : perception (Perc.), cognition (Cog.) et évaluation globale (Ovr.). Chaque ensemble de données comprend une image ou un fichier audio/vidéo en entrée et une tâche d'analyse syntaxique structurée correspondante.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.