日付

1年前

サイズ

60.8 MB

データセット構成

Paper URL

arxiv.org

タグ

マルチモーダル

OCR

OCRBenchは、華中科技大学とMicrosoft Researchが共同で公開したテキスト認識ベンチマークデータセットです。このデータセットは、マルチモーダル大規模光学式文字認識（OCR）の評価ベンチマークです。関連する論文結果は以下の通りです。OCRBench: 大規模マルチモーダルモデルにおけるOCRの隠された謎について」は、さまざまなテキスト関連タスクにおける大規模マルチモーダルモデル (LMM) の OCR 機能を評価することを目的としています。このデータセットには、テキスト認識、シーンテキストの中央揃え、ドキュメントの方向付け、キー情報抽出 (KIE)、手書きの数式 (HMER) という 5 つの代表的なテキスト関連タスクから手動で選別され修正された 1,000 個の質問と回答のペアが含まれています。

データには以下が含まれます:

テキスト認識 300 枚の画像 (通常、不規則、芸術的、その他のテキストタイプを含む)。
シーンテキスト中心のビジュアル質問で200の質問に答えます。
ドキュメントガイドによる視覚的な質問で 200 の質問に答えます。
重要な情報を抽出するための 200 の質問。
手書きの数式認識 HME100k データセットからの 100 枚の画像。

OCRBench.torrent

シーディング 2ダウンロード中 0完了 83総ダウンロード数 245

OCRBench/
- README.md
  1.65 KB
- README.txt
  3.3 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

1年前

サイズ

60.8 MB

データセット構成

Paper URL

arxiv.org

タグ

マルチモーダル

OCR

データには以下が含まれます:

テキスト認識 300 枚の画像 (通常、不規則、芸術的、その他のテキストタイプを含む)。
シーンテキスト中心のビジュアル質問で200の質問に答えます。
ドキュメントガイドによる視覚的な質問で 200 の質問に答えます。
重要な情報を抽出するための 200 の質問。
手書きの数式認識 HME100k データセットからの 100 枚の画像。

OCRBench.torrent

シーディング 2ダウンロード中 0完了 83総ダウンロード数 245

OCRBench/
- README.md
  1.65 KB
- README.txt
  3.3 KB

DRACOクロスドメイン深層研究ベンチマークデータセット

2ヶ月前

地上情報源による世界洪水イベントデータセット

3ヶ月前

CHIMERA一般推論合成データセット

4ヶ月前

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

OCRBench テキスト認識ベンチマークデータセット

データには以下が含まれます:

AIでAIを構築

HyperAI Newsletters

Command Palette

OCRBench テキスト認識ベンチマークデータセット

データには以下が含まれます:

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

OCRBench テキスト認識ベンチマークデータセット

データには以下が含まれます:

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

MCIFマルチモーダルクロスランゲージ指導データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

MCIFマルチモーダルクロスランゲージ指導データセット