Ensemble De Données De Compréhension Du Langage Multimodal ShapeWorld
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

ShapeWorld est une nouvelle méthode et un nouveau cadre d'évaluation de modèle d'apprentissage profond multimodal qui se concentre sur la capacité de généralisation du style sémantique formel. Dans ce cadre, des données artificielles sont générées automatiquement selon des spécifications prédéfinies. Cette génération de données contrôlée permet d’introduire des configurations d’instances inédites lors de l’évaluation, obligeant ainsi le système à recombiner les concepts appris de manière novatrice.
Le MIT a publié cet ensemble de données.