Command Palette
Search for a command to run...
FishEye8K : Un benchmark et un jeu de données pour la détection d'objets avec caméra fisheye
FishEye8K : Un benchmark et un jeu de données pour la détection d'objets avec caméra fisheye
Résumé
Avec les progrès de l’intelligence artificielle, la détection d’objets routiers est devenue un sujet majeur en vision par ordinateur, principalement basée sur des caméras à perspective. Les objectifs à lentille fisheye offrent une couverture panoramique omnidirectionnelle, permettant de surveiller les carrefours routiers avec un nombre réduit de caméras, bien que cette approche introduise des distorsions visuelles. À notre connaissance, aucun jeu de données ouvert n’est actuellement disponible pour la surveillance du trafic à l’aide de caméras fisheye. Ce papier présente un nouveau jeu de données ouvert, baptisé FishEye8K, dédié aux tâches de détection d’objets sur les routes, comprenant 157 000 boîtes englobantes réparties sur cinq catégories : piéton, vélo, voiture, bus et camion. Par ailleurs, nous fournissons des résultats de référence pour des modèles de pointe (SoTA), notamment des variantes de YOLOv5, YOLOR, YOLO7 et YOLOv8. Le jeu de données comprend 8 000 images issues de 22 vidéos capturées à Hsinchu (Taïwan) à l’aide de 18 caméras fisheye, avec des résolutions de 1080×1080 et 1280×1280. Le processus d’annotation et de validation des données a été particulièrement ardu et chronophage, en raison de l’immense champ de vision panoramique et hémisphérique des images issues des caméras fisheye, ainsi que de la forte densité de participants à la circulation, notamment les conducteurs de scooters. Pour éviter tout biais, les images provenant d’une même caméra ont été attribuées soit à l’ensemble d’entraînement, soit à l’ensemble de test, en maintenant un ratio d’environ 70:30 pour le nombre d’images et de boîtes englobantes par catégorie. Les résultats expérimentaux montrent que YOLOv8 et YOLOR obtiennent les meilleurs performances respectivement pour des tailles d’entrée de 640×640 et 1280×1280. Le jeu de données sera mis à disposition sur GitHub, avec des formats d’annotation compatibles PASCAL VOC, MS COCO et YOLO. Le benchmark FishEye8K apportera une contribution significative au domaine de l’analyse vidéo en caméra fisheye et aux applications de villes intelligentes.