HyperAIHyperAI

Command Palette

Search for a command to run...

CC-OCR-Texterkennungsdatensatz

Date

vor einem Jahr

Size

1.49 GB

Organization

Alibaba-Gruppe
Huazhong Universität für Wissenschaft und Technologie
Technische Universität Südchina

Publish URL

github.com

Paper URL

arxiv.org

Der CC-OCR-Datensatz wurde 2024 gemeinsam von der Alibaba Group, der Huazhong University of Science and Technology und der South China University of Technology entwickelt, um einen umfassenden und anspruchsvollen Benchmark für die Bewertung der Leistung großer multimodaler Modelle bei Texterkennungsaufgaben (OCR) bereitzustellen.CC-OCR: Ein umfassender und anspruchsvoller OCR-Benchmark zur Bewertung großer multimodaler Modelle im Bereich der Alphabetisierung".

Der Datensatz deckt vier Kernaufgaben ab: Lesen von Texten in mehreren Szenen, Lesen von Texten in mehreren Sprachen, Dokumentanalyse und Extraktion wichtiger Informationen und enthält 39 Teilmengen und 7.058 vollständig annotierte Bilder. Die Einführung von CC-OCR schließt die Lücke bei der Bewertung aktueller multimodaler Modelle in komplexen Strukturen und feinkörnigen visuellen Herausforderungen und ist von großer Bedeutung für die Förderung des Fortschritts multimodaler Modelle in praktischen Anwendungen.

CC-OCR.torrent
Seeding 2Downloading 0Completed 205Total Downloads 395
  • CC-OCR/
    • README.md
      1.52 KB
    • README.txt
      3.04 KB
      • data/
        • CC-OCR.zip
          1.49 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp