Multilabel-Bildklassifikation mittels adaptiven Graph-Convolutional Networks (ML-AGCN)
In diesem Paper wird ein neuartiger, graphenbasierter Ansatz für die Mehrfachlabel-Bildklassifikation vorgestellt, der als Multi-Label Adaptive Graph Convolutional Network (ML-AGCN) bezeichnet wird. Graphenbasierte Methoden haben großes Potenzial im Bereich der Mehrfachlabel-Klassifikation gezeigt. Allerdings werden bei diesen Ansätzen die Graphtopologien heuristisch festgelegt, um Label-Abhängigkeiten zu modellieren, was möglicherweise nicht optimal ist. Um dieses Problem anzugehen, schlagen wir vor, die Topologie end-to-end zu lernen. Konkret integrieren wir eine auf Aufmerksamkeit basierende Mechanik zur Schätzung der paarweisen Relevanz zwischen Graphknoten sowie eine auf Ähnlichkeit basierende Mechanik zur Erhaltung der Merkmalsähnlichkeit zwischen verschiedenen Knoten. Dies ermöglicht eine flexiblere, adaptivere Modellierung des Graphen. Experimentelle Ergebnisse werden auf zwei etablierten Datensätzen, nämlich MS-COCO und VG-500, präsentiert. Die Ergebnisse zeigen, dass ML-AGCN state-of-the-art-Methoden übertrifft, während gleichzeitig die Anzahl der Modellparameter reduziert wird.