HyperAIHyperAI

Command Palette

Search for a command to run...

TextOCR テキスト認識データセット

Discordで議論

日付

3年前

データセット構成

公開URL

textvqa.org

Paper URL

arxiv.org

ライセンス

CC BY 4.0

Featured Image

OCR は光学式文字認識の略で、あらゆるシーン内のテキストを検出および認識するために使用されるデータ セットです。 TextOCR は、TextVQA の画像に対して約 100 万の高品質な単語の注釈を提供し、視覚的な質問応答や画像キャプションなどの下流タスクでエンドツーエンドの推論を実行できます。

データセットには以下が含まれます。

  • TextVQA データセットからの 28,134 枚の画像
  • 903,096 の注釈付きシーンテキスト単語
  • 画像あたり平均 32 個の関連ワード

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています