HyperAI超神経

CC-OCR テキスト認識データセット

日付

3ヶ月前

サイズ

1.49 GB

組織

華中科学技術大学
華南理工大学

公開URL

github.com

CC-OCR データセットは、テキスト認識 (OCR) タスクにおける大規模なマルチモーダル モデルのパフォーマンスを評価するための包括的かつ挑戦的なベンチマークを提供することを目的として、2024 年にアリババ グループ、華中科技大学、華南理工大学によって共同で開発されました。CC-OCR: 読み書き能力における大規模なマルチモーダルモデルを評価するための包括的かつ挑戦的な OCR ベンチマーク”。

このデータセットは、マルチシーンテキスト読み取り、多言語テキスト読み取り、ドキュメント解析、キー情報抽出という 4 つのコアタスクをカバーしており、39 のサブセットと 7,058 枚の完全に注釈が付けられた画像が含まれています。 CC-OCR の導入は、複雑な構造やきめ細かい視覚的課題における現在のマルチモーダル モデルの評価のギャップを埋め、実際のアプリケーションにおけるマルチモーダル モデルの進歩を促進する上で大きな意義を持ちます。

CC-OCR.torrent
シーディング 2ダウンロード中 1ダウンロード完了 52総ダウンロード数 94
  • CC-OCR/
    • README.md
      1.52 KB
    • README.txt
      3.04 KB
      • data/
        • CC-OCR.zip
          1.49 GB