Date

il y a 9 mois

Taille

6.43 GB

Organisation

URL du document

2501.00321

Balises

OCR

OCRBench-v2 est un benchmark d'évaluation de reconnaissance optique de caractères (OCR) multimodal à grande échelle, publié en 2025 par l'Université des sciences et technologies de Huazhong, l'Université de technologie de Chine du Sud, ByteDance et d'autres institutions. Les résultats de l'étude sont les suivants :OCRBench v2 : une référence améliorée pour l'évaluation de grands modèles multimodaux sur la localisation et le raisonnement de textes visuels", qui vise à évaluer les capacités OCR des grands modèles multimodaux (LMM) dans différentes tâches liées au texte. Cet ensemble de données est une mise à niveau à grande échelle basée sur OCRBench. Il comprend 10 000 paires de questions-réponses chinois-anglais vérifiées manuellement, sous forme de test public, ainsi qu'un test privé supplémentaire composé de 1 500 images de texte enrichi annotées manuellement, provenant de diverses sources, notamment des livres imprimés, des livres numériques, des documents numérisés et du contenu web. Les données couvrent 31 scénarios textuels typiques et 23 sous-tâches, classés en huit fonctions OCR principales : reconnaissance de texte, détection de texte, localisation de références textuelles, extraction de relations, analyse d'éléments, opérations mathématiques, compréhension visuelle et raisonnement cognitif.

OCRBenchv2.torrent

Seeding 2Téléchargement 0Terminé 38Total Downloads 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 5 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 6 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 9 mois

Taille

6.43 GB

Organisation

URL du document

2501.00321

Balises

OCR

OCRBenchv2.torrent

Seeding 2Téléchargement 0Terminé 38Total Downloads 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

il y a 4 mois

Ensemble De Données EEG THINGS-EEG

il y a 5 mois

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

il y a 5 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 5 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 6 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence Pour La Reconnaissance De Texte OCRBench-v2

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour La Reconnaissance De Texte OCRBench-v2

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour La Reconnaissance De Texte OCRBench-v2

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts