HyperAI

Ensemble De Données De Reconnaissance De Texte CC-OCR

Date

il y a 4 mois

Taille

1.49 GB

Organisation

Université des sciences et technologies de Huazhong
Université de technologie de Chine du Sud

URL de publication

github.com

L'ensemble de données CC-OCR a été développé conjointement par Alibaba Group, l'Université des sciences et technologies de Huazhong et l'Université de technologie de Chine du Sud en 2024 pour fournir une référence complète et stimulante pour évaluer les performances de grands modèles multimodaux dans les tâches de reconnaissance de texte (OCR).CC-OCR : une référence OCR complète et exigeante pour l'évaluation de grands modèles multimodaux en alphabétisation".

L'ensemble de données couvre quatre tâches principales : la lecture de texte multi-scènes, la lecture de texte multilingue, l'analyse de documents et l'extraction d'informations clés, et contient 39 sous-ensembles et 7 058 images entièrement annotées. Le lancement de CC-OCR comble le vide dans l’évaluation des modèles multimodaux actuels dans les structures complexes et les défis visuels à granularité fine, et est d’une grande importance pour promouvoir les progrès des modèles multimodaux dans les applications pratiques.

CC-OCR.torrent
Partage 1Téléchargement 1Terminés 69Téléchargements totaux 117
  • CC-OCR/
    • README.md
      1.52 KB
    • README.txt
      3.04 KB
      • data/
        • CC-OCR.zip
          1.49 GB