Symmetrie und Gruppe in Attribut-Objekt-Zusammensetzungen

Attribute und Objekte können vielfältige Zusammensetzungen bilden. Um die kompositionelle Natur dieser allgemeinen Konzepte zu modellieren, ist es sinnvoll, sie durch Transformationen wie Kopplung und Entkopplung zu lernen. Komplexe Transformationen müssen jedoch bestimmten Prinzipien genügen, um ihre Rationalität zu gewährleisten. In diesem Artikel stellen wir zunächst ein bisher vernachlässigtes Prinzip der Attribut-Objekt-Transformation vor: die Symmetrie. Beispielsweise sollte die Kopplung des Attributs „geschält“ mit dem Objekt „Apfel“ das Ergebnis „geschälter Apfel“ ergeben, und die Entkopplung von „geschält“ vom Apfel sollte weiterhin das Objekt „Apfel“ liefern. Unter Einbeziehung des Symmetrieprinzips wird ein Transformationsframework auf Basis der Gruppentheorie entwickelt, das als SymNet bezeichnet wird. SymNet besteht aus zwei Modulen: dem Kopplungsnetzwerk und dem Entkopplungsnetzwerk. Unter Verwendung der Gruppenaxiome und der Symmetrieeigenschaft als Zielvorgaben setzen wir tiefe neuronale Netze zur Implementierung von SymNet ein und trainieren es in einer end-to-end-Paradigma. Darüber hinaus schlagen wir eine Erkennungsmethode basierend auf der relativen Bewegungsweite (Relative Moving Distance, RMD) vor, die die Veränderung von Attributen anstelle des Attributmusters selbst zur Klassifikation nutzt. Unser Ansatz zur Symmetrielernung kann für die kompositionelle Zero-Shot-Lernaufgabe eingesetzt werden und erreicht auf gängigen Benchmarks eine bessere Leistung als die derzeit beste Methode. Der Quellcode ist unter https://github.com/DirtyHarryLYL/SymNet verfügbar.