Command Palette
Search for a command to run...
Décalage de l'attention vers la détection des objets saillants vidéo
{ Jianbing Shen Ming-Ming Cheng Wenguan Wang Deng-Ping Fan}

Résumé
La dernière décennie a vu une croissance marquée de l'intérêt pour la détection des objets saillants dans les vidéos (VSOD, Video Salient Object Detection). Toutefois, la communauté scientifique manquait depuis longtemps d'un jeu de données VSOD bien établi, représentatif de scènes dynamiques réelles et doté d'annotations de haute qualité. Pour remédier à ce manque, nous avons soigneusement collecté un jeu de données DAVSOD (Densely Annotated VSOD) cohérent avec l'attention visuelle, comprenant 226 vidéos et 23 938 images couvrant une grande diversité de scènes réalistes, d'objets, d'instances et de mouvements. Grâce à des données réelles de fixation oculaire humaine associées, nous avons obtenu des vérités terrain précises. Ce travail constitue la première étude à souligner explicitement le défi du décalage de saillance, c’est-à-dire le fait que l’objet saillant dans une vidéo puisse évoluer de manière dynamique au fil du temps. Afin de fournir à la communauté une référence complète, nous évaluons de manière systématique 17 algorithmes représentatifs de VSOD sur sept jeux de données existants, ainsi que sur notre DAVSOD, totalisant 84 000 images (le plus grand ensemble à ce jour). En utilisant trois métriques célèbres, nous présentons une analyse approfondie et éclairante des performances. En outre, nous proposons un modèle de référence, doté d’un convLSTM sensible au décalage de saillance, capable de capturer efficacement la dynamique de la saillance vidéo en apprenant le comportement humain de déplacement de l’attention. Des expériences étendues ouvrent la voie à des perspectives prometteuses pour le développement et la comparaison future des modèles.
Benchmarks
| Benchmark | Méthodologie | Métriques |
|---|---|---|
| video-salient-object-detection-on-davis-2016 | SSAV | AVERAGE MAE: 0.028 MAX E-MEASURE: 0.948 MAX F-MEASURE: 0.861 S-Measure: 0.893 |
| video-salient-object-detection-on-davsod | SSAV | Average MAE: 0.084 S-Measure: 0.755 max E-Measure: 0.806 max F-Measure: 0.659 |
| video-salient-object-detection-on-davsod-1 | SSAV | Average MAE: 0.117 S-Measure: 0.661 max E-measure: 0.723 |
| video-salient-object-detection-on-davsod-2 | SSAV | Average MAE: 0.114 S-Measure: 0.619 max E-measure: 0.696 |
| video-salient-object-detection-on-fbms-59 | SSAV | AVERAGE MAE: 0.040 MAX E-MEASURE: 0.926 MAX F-MEASURE: 0.865 S-Measure: 0.879 |
| video-salient-object-detection-on-mcl | SSAV | AVERAGE MAE: 0.026 MAX E-MEASURE: 0.889 MAX F-MEASURE: 0.773 S-Measure: 0.819 |
| video-salient-object-detection-on-segtrack-v2 | SSAV | AVERAGE MAE: 0.023 MAX F-MEASURE: 0.801 S-Measure: 0.850 max E-measure: 0.917 |
| video-salient-object-detection-on-uvsd | SSAV | Average MAE: 0.025 S-Measure: 0.860 max E-measure: 0.939 |
| video-salient-object-detection-on-visal | SSAV | Average MAE: 0.021 S-Measure: 0.942 max E-measure: 0.980 |
| video-salient-object-detection-on-vos-t | SSAV | Average MAE: 0.074 S-Measure: 0.819 max E-measure: 0.839 |
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.