Reconnaissance des gestes de régulation du trafic pour les véhicules autonomes

Un conducteur de voiture sait comment réagir aux gestes des agents de circulation. Il n’en va pas de même pour les véhicules autonomes, sauf s’ils sont équipés de fonctionnalités de reconnaissance des gestes de régulation du trafic routier. Dans ce travail, nous abordons la limitation des jeux de données actuels pour la conduite autonome, qui ne fournissent pas de données d’apprentissage adéquates pour la reconnaissance des gestes de régulation du trafic. Nous introduisons un nouveau jeu de données basé sur des entrées squelettes corporels 3D, permettant de classifier les gestes de régulation du trafic à chaque pas de temps. Ce jeu de données comprend 250 séquences provenant de plusieurs acteurs, avec une durée variant de 16 à 90 secondes par séquence. Pour évaluer notre jeu de données, nous proposons huit modèles de traitement séquentiel fondés sur des réseaux neuronaux profonds, tels que des réseaux récurrents, des mécanismes d’attention, des réseaux de convolution temporelle et des réseaux de convolution sur graphe. Nous présentons une évaluation et une analyse approfondies de toutes les approches sur notre jeu de données, ainsi qu’une évaluation quantitative réelle du monde réel. Le code source et le jeu de données sont accessibles publiquement.