日付

1年前

サイズ

1.49 GB

データセット構成

公開URL

Paper URL

タグ

CC-OCR データセットは、テキスト認識 (OCR) タスクにおける大規模なマルチモーダルモデルのパフォーマンスを評価するための包括的かつ挑戦的なベンチマークを提供することを目的として、2024 年にアリババグループ、華中科技大学、華南理工大学によって共同で開発されました。CC-OCR: 読み書き能力における大規模なマルチモーダルモデルを評価するための包括的かつ挑戦的な OCR ベンチマーク”。このデータセットは、マルチシーンテキスト読み取り、多言語テキスト読み取り、ドキュメント解析、キー情報抽出という 4 つのコアタスクをカバーしており、39 のサブセットと 7,058 枚の完全に注釈が付けられた画像が含まれています。 CC-OCR の導入は、複雑な構造やきめ細かい視覚的課題における現在のマルチモーダルモデルの評価のギャップを埋め、実際のアプリケーションにおけるマルチモーダルモデルの進歩を促進する上で大きな意義を持ちます。

CC-OCR.torrent

シーディング 2ダウンロード中 0完了 232総ダウンロード数 420