HyperAI

CORD-Datensatz Zur Informationsextraktion

Datum

vor 2 Jahren

Größe

1.91 GB

Organisation

Veröffentlichungs-URL

github.com

Lizenz

CC BY 4.0

特色图像

CORD steht für Consolidated Receipt Dataset for Post-OCR Parsing, also einen Belegdatensatz für die Post-OCR-Analyse. Der Datensatz enthält Tausende indonesischer Quittungen (einschließlich Bilder und Box-/Textanmerkungen für OCR und mehrstufige semantische Beschriftungen zum Parsen).

CORD.torrent
Seeding 1Herunterladen 1Abgeschlossen 365Gesamtdownloads 551
  • CORD/
    • .gitattributes
      1.7 KB
    • README.md
      2.64 KB
    • README.txt
      3.59 KB
      • data/
        • CORD.zip
          1.91 GB
    • dataset_infos.json
      1.91 GB