日付
組織
公開URL
textvqa.org
ライセンス
其他
タグ
カテゴリ
TextCaps は、主に画像内のテキスト認識に使用されるデータセットです。データセットには 28,408 枚の画像と 142,040 件の説明が含まれています。データセットは、モデルに画像内のテキストを識別して、テキスト内のどこをコピーまたは言い換えする必要があるかを判断するように依頼します。