Multilabel-Bildklassifikation mittels adaptiven Graph-Convolutional Networks (ML-AGCN)
{Djamila Aouada Oyebade Oyedotun Enjie Ghorbel Inder Pal Singh}
Abstract
In diesem Paper wird ein neuartiger, graphenbasierter Ansatz für die Mehrfachlabel-Bildklassifikation vorgestellt, der als Multi-Label Adaptive Graph Convolutional Network (ML-AGCN) bezeichnet wird. Graphenbasierte Methoden haben großes Potenzial im Bereich der Mehrfachlabel-Klassifikation gezeigt. Allerdings werden bei diesen Ansätzen die Graphtopologien heuristisch festgelegt, um Label-Abhängigkeiten zu modellieren, was möglicherweise nicht optimal ist. Um dieses Problem anzugehen, schlagen wir vor, die Topologie end-to-end zu lernen. Konkret integrieren wir eine auf Aufmerksamkeit basierende Mechanik zur Schätzung der paarweisen Relevanz zwischen Graphknoten sowie eine auf Ähnlichkeit basierende Mechanik zur Erhaltung der Merkmalsähnlichkeit zwischen verschiedenen Knoten. Dies ermöglicht eine flexiblere, adaptivere Modellierung des Graphen. Experimentelle Ergebnisse werden auf zwei etablierten Datensätzen, nämlich MS-COCO und VG-500, präsentiert. Die Ergebnisse zeigen, dass ML-AGCN state-of-the-art-Methoden übertrifft, während gleichzeitig die Anzahl der Modellparameter reduziert wird.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| multi-label-image-classification-on-mscoco | ML-AGCN | mean average precision: 86.9 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.