Ensemble De Données De Détection D'objets En Streaming Argoverse-HD
Date
Taille
URL de publication
Licence
其他
Catégories

Argoverse-HD est un ensemble de données sur la détection d'objets dans les médias en streaming, y compris la détection d'objets en temps réel, la détection d'objets vidéo, le suivi et la prédiction à court terme. L'ensemble de données contient des données vidéo d'Argoverse 1.1, avec un total de 70 000 images et 1,3 million de cadres de délimitation. Ces vidéos ont des annotations de style MS COCO et des identifiants de piste avec une résolution de 1920 x 1200 à 30 FPS. Ces annotations sont rétrocompatibles avec COCO, de sorte que les chercheurs peuvent évaluer directement les modèles pré-entraînés COCO sur cet ensemble de données pour estimer l'efficacité du modèle ou la capacité de généralisation entre ensembles de données.
Argoverse-HD est un ensemble de données pour le Stream Perception Challenge, qui comprend deux pistes :
- Détection unique (détection d'objets en temps réel) : dans ce parcours, les participants développeront des détecteurs d'objets à image unique, similaires aux défis COCO et LVIS. La principale différence est que l’évaluation évaluera la latence plutôt que la précision du contenu multimédia en streaming.
- Full Stack : Dans cette piste, l'approche est illimitée. Il est toutefois très probable que le suivi et la prédiction seront utilisés pour compenser les retards des sondes.
Par défaut, toutes les soumissions ont leurs latences mesurées par la boîte à outils officielle du GPU V100.