HyperAIHyperAI

Command Palette

Search for a command to run...

TextOCR テキスト認識データセット

Discuss on Discord

Date

3年前

Organization

Publish URL

textvqa.org

Paper URL

arxiv.org

License

CC BY 4.0

Featured Image

OCR は光学式文字認識の略で、あらゆるシーン内のテキストを検出および認識するために使用されるデータ セットです。 TextOCR は、TextVQA の画像に対して約 100 万の高品質な単語の注釈を提供し、視覚的な質問応答や画像キャプションなどの下流タスクでエンドツーエンドの推論を実行できます。

データセットには以下が含まれます。

  • TextVQA データセットからの 28,134 枚の画像
  • 903,096 の注釈付きシーンテキスト単語
  • 画像あたり平均 32 個の関連ワード

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています