Command Palette
Search for a command to run...
Pythia v0.1 : la Solution Vainqueure du Défi VQA 2018
Pythia v0.1 : la Solution Vainqueure du Défi VQA 2018
Yu Jiang* Vivek Natarajan* Xinlei Chen* Marcus Rohrbach Dhruv Batra Devi Parikh
Résumé
Ce document décrit Pythia v0.1, la soumission gagnante de l'équipe A-STAR de Facebook AI Research (FAIR) au défi VQA 2018.Notre point de départ est une réimplémentation modulaire du modèle bottom-up top-down (up-down). Nous montrons que, grâce à des modifications subtiles mais importantes de l'architecture du modèle et du calendrier d'apprentissage, ainsi qu'à un affinage des caractéristiques d'image et à l'ajout d'une augmentation de données, nous pouvons améliorer significativement les performances du modèle up-down sur le jeu de données VQA v2.0 — passant de 65,67 % à 70,22 %.De plus, en utilisant un ensemble diversifié de modèles entraînés avec différentes caractéristiques et sur différents jeux de données, nous sommes capables d'améliorer considérablement la méthode « standard » d'ensemblage (c'est-à-dire le même modèle avec différentes graines aléatoires) de 1,31 %. Dans l'ensemble, nous obtenons un score de 72,27 % sur la partition test-std du jeu de données VQA v2.0. Notre code complet (entraînement, évaluation, augmentation de données, ensemblage) et nos modèles pré-entraînés sont disponibles publiquement sur : https://github.com/facebookresearch/pythia