日期
机构
发布地址
textvqa.org
许可协议
其他
标签
画像の説明
テキストの生成
視覚的推論
分类
TextCaps は、主に画像内のテキスト認識に使用されるデータセットです。データセットには 28,408 枚の画像と 142,040 件の説明が含まれています。データセットは、モデルに画像内のテキストを識別して、テキスト内のどこをコピーまたは言い換えする必要があるかを判断するように依頼します。