Ein bidirektionaler Nachrichtenübertragungsmodell für die Erkennung auffälliger Objekte
{Gang Wang Ju Dai You He Huchuan Lu Lu Zhang}

Abstract
Die jüngsten Fortschritte im Bereich der auffälligen Objektdetektion profitieren maßgeblich von Fully Convolutional Neural Networks (FCN). Die Aufmerksamkeitsmerkmale, die in mehrstufigen konvolutionellen Merkmalen enthalten sind, ergänzen sich gegenseitig und sind somit von großer Bedeutung für die Erkennung auffälliger Objekte. Die Integration mehrstufiger Merkmale stellt daher ein offenes Problem in der Aufmerksamkeitsdetektion dar. In diesem Artikel stellen wir ein neuartiges bidirektionales Nachrichtenübertragungsmodell vor, das zur Integration mehrstufiger Merkmale für die auffällige Objektdetektion eingesetzt wird. Zunächst verwenden wir ein Multi-Scale Context-aware Feature Extraction Module (MCFEM), um reichhaltige Kontextinformationen aus mehrstufigen Merkmalskarten zu erfassen. Anschließend wird eine bidirektionale Struktur entworfen, um Nachrichten zwischen den verschiedenen Merkmalsstufen zu übertragen, wobei eine Gatterfunktion zur Steuerung der Nachrichtenübertragungsrate eingesetzt wird. Die Merkmale, die nach der Nachrichtenübertragung erhalten werden, kodieren gleichzeitig semantische Informationen und räumliche Details und dienen zur Vorhersage von Aufmerksamkeitskarten. Schließlich werden die vorhergesagten Ergebnisse effizient kombiniert, um die endgültige Aufmerksamkeitskarte zu generieren. Quantitative und qualitative Experimente auf fünf Benchmark-Datensätzen zeigen, dass unser vorgeschlagenes Modell gegenüber den aktuellen Stand der Technik unter verschiedenen Bewertungsmetriken überzeugt.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| salient-object-detection-on-istd | BMPM | Balanced Error Rate: 7.10 |
| salient-object-detection-on-pascal-s | BMPM | MAE: 0.074 |
| salient-object-detection-on-sbu | BMPM | Balanced Error Rate: 6.17 |
| salient-object-detection-on-sod | BMPM | MAE: 0.108 |
| salient-object-detection-on-ucf | BMPM | Balanced Error Rate: 8.09 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.