Who's Waldo 画像説明データセット

Who's Waldo には 270,000 個の画像とテキストのペアが含まれており、言及された名前とそれに対応する視覚領域の間の位置関係に自動的に注釈が付けられます。
Who's Waldo データセットは、ウィキメディア コモンズで自由にライセンスされている画像と説明から構築されています。 Who's Waldo は、人間中心のビジョン基盤のベンチマーク データセットです。
Who's Waldo には 270,000 個の画像とテキストのペアが含まれており、言及された名前とそれに対応する視覚領域の間の位置関係に自動的に注釈が付けられます。
Who's Waldo データセットは、ウィキメディア コモンズで自由にライセンスされている画像と説明から構築されています。 Who's Waldo は、人間中心のビジョン基盤のベンチマーク データセットです。