HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Verschiebung des Fokus auf die Video-Salient-Object-Detection

{ Jianbing Shen Ming-Ming Cheng Wenguan Wang Deng-Ping Fan}

Verschiebung des Fokus auf die Video-Salient-Object-Detection

Abstract

Das letzte Jahrzehnt hat ein wachsendes Interesse an der Erkennung auffälliger Objekte in Videos (VSOD) gezeigt. Doch die Forschungsgemeinschaft litt lange Zeit unter dem Fehlen eines etablierten VSOD-Datensatzes, der realistische dynamische Szenen mit hochwertigen Annotationen repräsentativ abbildet. Um dieses Problem anzugehen, haben wir systematisch einen visuell-attentiven, dicht annotierten Datensatz namens DAVSOD (Densely Annotated VSOD) zusammengestellt, der 226 Videos mit insgesamt 23.938 Frames umfasst und eine Vielzahl realistischer Szenen, Objekte, Instanzen und Bewegungen abdeckt. Durch die Kombination mit realen menschlichen Augenfixierungsdaten erhalten wir präzise Ground-Truth-Daten. Dies ist die erste Arbeit, die explizit die Herausforderung des Saliency-Shifts betont, also die dynamische Veränderung des auffälligen Objekts oder der auffälligen Objekte innerhalb eines Videos. Um der Gemeinschaft einen umfassenden Benchmark zur Verfügung zu stellen, bewerten wir systematisch 17 repräsentative VSOD-Algorithmen über sieben bestehende VSOD-Datensätze sowie unseren DAVSOD-Datensatz mit insgesamt 84.000 Frames (größter Datensatz dieser Art). Unter Verwendung dreier bekannter Metriken präsentieren wir eine umfassende und tiefgehende Leistungsanalyse. Darüber hinaus stellen wir ein Basismodell vor, das über einen saliency-shift-orientierten convLSTM verfügt, welcher die Dynamik der Video-Saliency effizient durch das Lernen menschlicher Aufmerksamkeitsverschiebungen erfassen kann. Umfangreiche Experimente eröffnen vielversprechende neue Wege für die Weiterentwicklung und Bewertung von Modellen.

Benchmarks

BenchmarkMethodikMetriken
video-salient-object-detection-on-davis-2016SSAV
AVERAGE MAE: 0.028
MAX E-MEASURE: 0.948
MAX F-MEASURE: 0.861
S-Measure: 0.893
video-salient-object-detection-on-davsodSSAV
Average MAE: 0.084
S-Measure: 0.755
max E-Measure: 0.806
max F-Measure: 0.659
video-salient-object-detection-on-davsod-1SSAV
Average MAE: 0.117
S-Measure: 0.661
max E-measure: 0.723
video-salient-object-detection-on-davsod-2SSAV
Average MAE: 0.114
S-Measure: 0.619
max E-measure: 0.696
video-salient-object-detection-on-fbms-59SSAV
AVERAGE MAE: 0.040
MAX E-MEASURE: 0.926
MAX F-MEASURE: 0.865
S-Measure: 0.879
video-salient-object-detection-on-mclSSAV
AVERAGE MAE: 0.026
MAX E-MEASURE: 0.889
MAX F-MEASURE: 0.773
S-Measure: 0.819
video-salient-object-detection-on-segtrack-v2SSAV
AVERAGE MAE: 0.023
MAX F-MEASURE: 0.801
S-Measure: 0.850
max E-measure: 0.917
video-salient-object-detection-on-uvsdSSAV
Average MAE: 0.025
S-Measure: 0.860
max E-measure: 0.939
video-salient-object-detection-on-visalSSAV
Average MAE: 0.021
S-Measure: 0.942
max E-measure: 0.980
video-salient-object-detection-on-vos-tSSAV
Average MAE: 0.074
S-Measure: 0.819
max E-measure: 0.839

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Verschiebung des Fokus auf die Video-Salient-Object-Detection | Forschungsarbeiten | HyperAI