Une nouvelle IA combine vision et langage pour détecter les dangers routiers dans les vidéos de caméras urbaines
Des milliers de caméras de circulation à New York enregistrent des heures de vidéos chaque jour, mais l’analyse manuelle de ces données pour détecter des problèmes de sécurité routière reste une tâche coûteuse et peu réalisable pour la plupart des agences de transport. Des chercheurs de l’École d’ingénierie NYU Tandon ont désormais développé un système d’intelligence artificielle capable d’identifier automatiquement les collisions et les situations de danger imminent dans les vidéos existantes, en combinant raisonnement linguistique et analyse visuelle. Ce système, baptisé SeeUnsafe, pourrait révolutionner la manière dont les villes améliorent la sécurité routière sans nécessiter d’investissements massifs dans de nouveaux équipements. Publié dans la revue Accident Analysis & Prevention, cette recherche a remporté le prix Vision Zero de New York, une distinction annuelle décernée aux travaux alignés sur les priorités de sécurité routière de la ville et offrant des pistes concrètes d’action. Le professeur Kaan Ozbay, auteur principal de l’étude, a présenté ses résultats lors de la huitième édition du symposium Research on the Road. Le projet illustre une collaboration interdisciplinaire entre des experts en vision par ordinateur du nouveau Centre de robotique et d’intelligence incarnée de NYU et des chercheurs en sécurité routière du centre C2SMART, dirigé par Ozbay. SeeUnsafe permet d’identifier précisément où et quand se produisent les accidents ou les situations à risque, aidant ainsi les agences à repérer les intersections ou les conditions routières dangereuses avant qu’un accident grave ne survienne. Le système repose sur des modèles d’intelligence artificielle pré-entraînés capables de comprendre à la fois les images et le langage, marquant l’une des premières applications de modèles linguistiques multimodaux à l’analyse de vidéos de circulation longues. « Avec mille caméras fonctionnant 24 heures sur 24 à New York, il est impossible de faire analyser manuellement tout ce flux vidéo », explique Ozbay. « SeeUnsafe permet aux autorités municipales d’exploiter pleinement leur investissement existant. » Contrairement aux approches traditionnelles, l’outil ne nécessite pas que les agences soient des spécialistes en vision par ordinateur ni qu’elles collectent et étiquettent leurs propres données pour entraîner un modèle. L’efficacité du système a été testée sur le jeu de données Toyota Woven Traffic Safety, où il a correctement classé les vidéos comme collisions, situations de danger immédiat ou circulation normale dans 76,71 % des cas. Il parvient même à identifier les usagers de la route impliqués dans les incidents, avec un taux de réussite pouvant atteindre 87,5 %. En s’appuyant sur les « près-accidents » — comme un véhicule passant trop près d’un piéton ou un changement de voie risqué —, le système permet une approche préventive, au lieu de réactive, en permettant l’ajustement anticipé de la signalisation, du réglage des feux de circulation ou de la conception des chaussées. Il génère également des rapports de sécurité en langage naturel, expliquant les facteurs déclencheurs (conditions météorologiques, densité du trafic, mouvements spécifiques) des incidents détectés. Bien que le système soit sensible à la précision du suivi d’objets et aux conditions de faible luminosité, il ouvre la voie à une utilisation plus large de l’IA pour « comprendre » le contexte de sécurité routière à partir de vastes volumes de vidéos. Les chercheurs envisagent son application à des caméras embarquées dans les véhicules, pour une évaluation en temps réel des risques depuis la perspective du conducteur. Ce travail s’inscrit dans une série de projets menés par C2SMART visant à améliorer les systèmes de transport de New York, notamment l’analyse de l’impact des camions électriques lourds sur l’infrastructure, l’effet des radars de vitesse sur le comportement des conducteurs, la création d’un « jumeau numérique » pour optimiser les temps d’intervention des pompiers, et le suivi des poids lourds sur l’expressway Brooklyn-Queens.
