Discordで議論

日付

4年前

データセット構成

公開URL

Paper URL

ライセンス

CC BY 4.0

タグ

テキスト生成

OCR は光学式文字認識の略で、あらゆるシーン内のテキストを検出および認識するために使用されるデータセットです。 TextOCR は、TextVQA の画像に対して約 100 万の高品質な単語の注釈を提供し、視覚的な質問応答や画像キャプションなどの下流タスクでエンドツーエンドの推論を実行できます。 データセットには以下が含まれます。

TextVQA データセットからの 28,134 枚の画像
903,096 の注釈付きシーンテキスト単語
画像あたり平均 32 個の関連ワード

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています