HyperAI
Command Palette
Search for a command to run...
Who's Waldo 画像説明データセット
日付
3年前
公開URL
Paper URL
ライセンス
Other

Who's Waldo には 270,000 個の画像とテキストのペアが含まれており、言及された名前とそれに対応する視覚領域の間の位置関係に自動的に注釈が付けられます。
Who's Waldo データセットは、ウィキメディア コモンズで自由にライセンスされている画像と説明から構築されています。 Who's Waldo は、人間中心のビジョン基盤のベンチマーク データセットです。
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。