Flickr30K エンティティは、Flickr30K データセットの拡張です。 Flickr30K エンティティは、Flickr30K データ セットの説明文で言及されている名詞をマークし、対応する境界ボックスをマークします。
このデータセットは、元の 158K の説明文に 244K の相互参照チェーンを追加し、同じ画像内の異なる説明文内の同じエンティティの言及を接続し、手動で注釈を付けた 276K の境界ボックスを関連付けます。このデータセットは、画像内のテキストエンティティの言及のローカリゼーションのための新しいベンチマークを定義するために使用されます。
做种 1
下载中 0
已完成 352
总下载 682