HyperAIHyperAI

Command Palette

Search for a command to run...

Retouchdown : Ajout du touchdown à StreetLearn en tant que ressource partageable pour les tâches d’ancrage linguistique dans Street View

Harsh Mehta Yoav Artzi Jason Baldridge Eugene Ie Piotr Mirowski

Résumé

Le jeu de données Touchdown (Chen et al., 2019) fournit des instructions rédigées par des annotateurs humains pour la navigation dans les rues de New York et pour la résolution de descriptions spatiales à un emplacement donné. Afin de permettre à la communauté scientifique plus large de travailler efficacement sur les tâches Touchdown, nous mettons publiquement à disposition les 29 000 panoramas Street View bruts nécessaires à ces tâches. Nous suivons le processus utilisé pour le lancement des données StreetLearn (Mirowski et al., 2019) afin de vérifier les panoramas à la recherche d’informations personnelles identifiables, et de les flouter si nécessaire. Ces images ont été intégrées au jeu de données StreetLearn et peuvent être obtenues via le même processus que précédemment pour StreetLearn. Nous fournissons également une implémentation de référence pour chacune des deux tâches Touchdown : navigation vision-langage (VLN) et résolution de descriptions spatiales (SDR). Nous comparons les résultats de notre modèle à ceux rapportés dans Chen et al. (2019), et montrons que les panoramas que nous avons ajoutés à StreetLearn soutiennent pleinement les deux tâches Touchdown et peuvent être utilisés de manière efficace pour des recherches ultérieures et des comparaisons.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp