日期
机构
发布地址
textvqa.org
许可协议
CC BY 4.0
标签
光学式文字認識
シーンテキスト検出
シーンテキスト認識
分类
テキスト認識
OCR は光学式文字認識の略で、あらゆるシーン内のテキストを検出および認識するために使用されるデータ セットです。 TextOCR は、TextVQA の画像に対して約 100 万の高品質な単語の注釈を提供し、視覚的な質問応答や画像キャプションなどの下流タスクでエンドツーエンドの推論を実行できます。
データセットには以下が含まれます。