Command Palette
Search for a command to run...
Apprentissage de détecteurs piétons à étape unique efficaces par ajustement asymptotique de localisation
{Xuezhi Liang Shengcai Liao Weidong Hu Wei Liu Xiao Chen}

Résumé
Bien que les détecteurs à deux étapes basés sur Faster R-CNN aient connu une amélioration significative de la précision dans la détection de piétons, ils restent trop lents pour des applications pratiques. Une solution consiste à simplifier ce processus en le transformant en un détecteur à une seule étape. Toutefois, les détecteurs actuels à une seule étape (par exemple SSD) n’ont pas encore atteint une précision compétitive sur les benchmarks courants de détection de piétons. Ce papier vise à concevoir un détecteur de piétons performant, combinant la vitesse de SSD et la précision de Faster R-CNN. Plus précisément, nous proposons un module structuralement simple mais efficace, appelé Asymptotic Localization Fitting (ALF), qui empile une série de prédicteurs afin d’évoluer progressivement, étape par étape, les boîtes d’ancrage par défaut de SSD vers des résultats de détection améliorés. En conséquence, durant l’entraînement, les prédicteurs ultérieurs bénéficient d’un plus grand nombre d’échantillons positifs de meilleure qualité, tout en permettant l’exploitation de négatifs plus difficiles grâce à l’augmentation des seuils d’IoU. Par ailleurs, une architecture de détection de piétons à une seule étape efficace (désignée ALFNet) est conçue, atteignant des performances de pointe sur CityPersons et Caltech, deux des plus grands benchmarks de détection de piétons, offrant ainsi un détecteur particulièrement attractif tant en précision qu’en vitesse. Le code est disponible à l’adresse suivante : \href{https://github.com/VideoObjectSearch/ALFNet}{https://github.com/VideoObjectSearch/ALFNet}.
Benchmarks
| Benchmark | Méthodologie | Métriques |
|---|---|---|
| pedestrian-detection-on-caltech | ALFNet | Reasonable Miss Rate: 6.1 |
| pedestrian-detection-on-caltech | ALFNet + CityPersons dataset | Reasonable Miss Rate: 4.5 |
| pedestrian-detection-on-citypersons | ALFNet | Bare MR^-2: 8.4 Heavy MR^-2: 51.9 Large MR^-2: 6.6 Medium MR^-2: 5.7 Partial MR^-2: 11.4 Reasonable MR^-2: 12.0 Small MR^-2: 19.0 Test Time: 0.27 |
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.