Effiziente relative Attributlernen mit Graph Neural Networks

Eine beträchtliche Menge an Forschungsarbeiten zu relativen Attributen liefert überzeugende Hinweise darauf, dass die Berücksichtigung von Bildpaaren entlang eines Kontinuums der Stärke hinsichtlich eines visuellen Attributs zu signifikanten Verbesserungen in einer Vielzahl von Aufgaben im Bereich der Bildverarbeitung führt. In diesem Paper zeigen wir, wie sich neu entwickelte Konzepte in Graph Neural Networks (GNNs) zu einer einheitlichen Lösung für verschiedene Probleme eignen, die im weit gefassten Bereich des Lernens relativer Attribute angesiedelt sind. Unser zentrales Konzept besteht darin, dass das Lernen relativer Attribute naturgemäß von der Ausnutzung der graphischen Struktur der Abhängigkeiten zwischen den verschiedenen relativen Attributen von Bildern profitiert, insbesondere dann, wenn in den Trainingsdaten lediglich eine partielle Ordnung der Attribute vorliegt. Wir nutzen Nachrichtenübertragung in einem probabilistischen grafischen Modell, um eine end-to-end-Lernung geeigneter Darstellungen der Bilder, ihrer Beziehungen sowie der Wechselwirkungen zwischen verschiedenen Attributen durchzuführen, die sich optimal an die gegebenen Annotationen anpasst. Unsere Experimente zeigen, dass dieser einfache end-to-end-Lernansatz mittels GNNs sowohl bei der Aufgabe des Lernens relativer Attribute als auch bei der binären Attributvorhersage eine konkurrenzfähige Genauigkeit erzielt, vergleichbar mit spezialisierten Methoden, dabei aber die Anforderungen an die Trainingsdaten und/oder die Anzahl der Parameter erheblich reduziert.