BDD100K : Un jeu de données diversifié pour l'apprentissage multitâche hétérogène

Les ensembles de données (datasets) sont à l'origine des progrès en vision, mais les ensembles de données existants pour la conduite sont pauvres en termes de contenu visuel et de tâches prises en charge pour étudier l'apprentissage multitâche dans le cadre de la conduite autonome. Les chercheurs sont généralement limités à l'étude d'un petit nombre de problèmes sur un seul ensemble de données, alors que les applications réelles de la vision par ordinateur nécessitent l'exécution de tâches de complexités variées. Nous avons construit BDD100K, le plus grand ensemble de vidéos de conduite avec 100 000 vidéos et 10 tâches, afin d'évaluer les progrès enthousiasmants des algorithmes de reconnaissance d'images dans le domaine de la conduite autonome. Cet ensemble de données présente une diversité géographique, environnementale et météorologique, ce qui est utile pour former des modèles moins susceptibles d'être surpris par de nouvelles conditions. Sur la base de cet ensemble de données diversifié, nous avons établi un benchmark pour l'apprentissage multitâche hétérogène et nous avons étudié comment résoudre ces tâches conjointement. Nos expériences montrent qu'il est nécessaire d'adopter des stratégies d'entraînement spéciales pour permettre aux modèles existants d'effectuer ces tâches hétérogènes. BDD100K ouvre la voie à des études futures dans ce domaine important.