HyperAI
Command Palette
Search for a command to run...
E-snli-ve 大規模視覚言語データセット

e-SNLI-VE は、自然言語説明を備えた大規模な視覚言語データセットであり、430,000 を超えるインスタンスが含まれており、すべての説明は画像コンテンツに基づいています。このデータセットは、e-SNLI データセットの説明と SNLI-VE データセットの画像と文のペアを結合することによって構築されます。
引用
@InProceedings{Kayser_2021_ICCV,
author = {Kayser, Maxime and Camburu, Oana-Maria and Salewski, Leonard and Emde, Cornelius and Do, Virginie and Akata, Zeynep and Lukasiewicz, Thomas},
title = {E-ViL: A Dataset and Benchmark for Natural Language Explanations in Vision-Language Tasks},
booktitle = {Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV)},
month = {October},
year = {2021},
pages = {1244-1254}
}
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。