日付

9ヶ月前

サイズ

6.43 GB

データセット構成

Paper URL

2501.00321

タグ

OCR

OCRBench-v2は、華中科技大学、華南理工大学、ByteDanceなどの機関によって2025年にリリースされた、マルチモーダル大規模モデル光学式文字認識（OCR）評価ベンチマークです。関連する論文の結果は次のとおりです。OCRBench v2: 視覚テキストのローカリゼーションと推論に関する大規模マルチモーダルモデルを評価するための改良ベンチマーク」は、さまざまなテキスト関連タスクにおける大規模マルチモーダルモデル (LMM) の OCR 機能を評価することを目的としています。このデータセットは、OCRBenchをベースにした大規模なアップグレードです。公開テストセットとして、手動で検証された中国語と英語の質問と回答のペア10,000件が含まれています。さらに、印刷書籍、電子書籍、スキャン文書、ウェブコンテンツなど、様々なソースから手動で注釈が付けられたリッチテキスト画像1,500件からなるプライベートテストセットも含まれています。このデータは、31の典型的なテキストシナリオと23のサブタスクをカバーし、8つのコアOCR機能（テキスト認識、テキスト検出、テキスト参照位置の特定、関係抽出、要素解析、数学演算、ビジュアルテキスト理解、知識推論）に分類されています。

OCRBenchv2.torrent

シーディング 2ダウンロード中 0完了 38総ダウンロード数 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

9ヶ月前

サイズ

6.43 GB

データセット構成

Paper URL

2501.00321

タグ

OCR

OCRBenchv2.torrent

シーディング 2ダウンロード中 0完了 38総ダウンロード数 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

DRACOクロスドメイン深層研究ベンチマークデータセット

2ヶ月前

CHIMERA一般推論合成データセット

4ヶ月前

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

Nemotron-Math-v2 数学推論データセット

5ヶ月前

GroundingME 複雑シーン理解評価データセット

6ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

6ヶ月前

TxT360-3efforts マルチタスク推論データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

OCRBench-v2 テキスト認識ベンチマークデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

OCRBench-v2 テキスト認識ベンチマークデータセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

OCRBench-v2 テキスト認識ベンチマークデータセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット