HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Décalage de l'attention vers la détection des objets saillants vidéo

{ Jianbing Shen Ming-Ming Cheng Wenguan Wang Deng-Ping Fan}

Décalage de l'attention vers la détection des objets saillants vidéo

Résumé

La dernière décennie a vu une croissance marquée de l'intérêt pour la détection des objets saillants dans les vidéos (VSOD, Video Salient Object Detection). Toutefois, la communauté scientifique manquait depuis longtemps d'un jeu de données VSOD bien établi, représentatif de scènes dynamiques réelles et doté d'annotations de haute qualité. Pour remédier à ce manque, nous avons soigneusement collecté un jeu de données DAVSOD (Densely Annotated VSOD) cohérent avec l'attention visuelle, comprenant 226 vidéos et 23 938 images couvrant une grande diversité de scènes réalistes, d'objets, d'instances et de mouvements. Grâce à des données réelles de fixation oculaire humaine associées, nous avons obtenu des vérités terrain précises. Ce travail constitue la première étude à souligner explicitement le défi du décalage de saillance, c’est-à-dire le fait que l’objet saillant dans une vidéo puisse évoluer de manière dynamique au fil du temps. Afin de fournir à la communauté une référence complète, nous évaluons de manière systématique 17 algorithmes représentatifs de VSOD sur sept jeux de données existants, ainsi que sur notre DAVSOD, totalisant 84 000 images (le plus grand ensemble à ce jour). En utilisant trois métriques célèbres, nous présentons une analyse approfondie et éclairante des performances. En outre, nous proposons un modèle de référence, doté d’un convLSTM sensible au décalage de saillance, capable de capturer efficacement la dynamique de la saillance vidéo en apprenant le comportement humain de déplacement de l’attention. Des expériences étendues ouvrent la voie à des perspectives prometteuses pour le développement et la comparaison future des modèles.

Benchmarks

BenchmarkMéthodologieMétriques
video-salient-object-detection-on-davis-2016SSAV
AVERAGE MAE: 0.028
MAX E-MEASURE: 0.948
MAX F-MEASURE: 0.861
S-Measure: 0.893
video-salient-object-detection-on-davsodSSAV
Average MAE: 0.084
S-Measure: 0.755
max E-Measure: 0.806
max F-Measure: 0.659
video-salient-object-detection-on-davsod-1SSAV
Average MAE: 0.117
S-Measure: 0.661
max E-measure: 0.723
video-salient-object-detection-on-davsod-2SSAV
Average MAE: 0.114
S-Measure: 0.619
max E-measure: 0.696
video-salient-object-detection-on-fbms-59SSAV
AVERAGE MAE: 0.040
MAX E-MEASURE: 0.926
MAX F-MEASURE: 0.865
S-Measure: 0.879
video-salient-object-detection-on-mclSSAV
AVERAGE MAE: 0.026
MAX E-MEASURE: 0.889
MAX F-MEASURE: 0.773
S-Measure: 0.819
video-salient-object-detection-on-segtrack-v2SSAV
AVERAGE MAE: 0.023
MAX F-MEASURE: 0.801
S-Measure: 0.850
max E-measure: 0.917
video-salient-object-detection-on-uvsdSSAV
Average MAE: 0.025
S-Measure: 0.860
max E-measure: 0.939
video-salient-object-detection-on-visalSSAV
Average MAE: 0.021
S-Measure: 0.942
max E-measure: 0.980
video-salient-object-detection-on-vos-tSSAV
Average MAE: 0.074
S-Measure: 0.819
max E-measure: 0.839

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Décalage de l'attention vers la détection des objets saillants vidéo | Articles de recherche | HyperAI