Stellen Sie sich durch Schlussfolgern vor: Eine schlussfolgerungsbasierende implizite semantische Datenvervollständigung für langgezogene Klassifikation

Daten aus der realen Welt folgen oft einer langen Schwanzverteilung, was zu einer erheblichen Degradierung der Leistung bestehender Klassifizierungsalgorithmen führt. Ein zentrales Problem besteht darin, dass Stichproben in den sogenannten Tail-Kategorien ihre intra-klassische Vielfalt nicht ausreichend widerspiegeln. Menschen können sich selbst bei erster Begegnung mit einer neuen Kategorie ein Bild von Proben in neuen Pose, Szenen und Blickwinkeln machen, basierend auf ihrem Vorwissen. Inspiriert durch dieses menschliche Verständnis schlagen wir eine neuartige, auf Schlussfolgerungen basierende, implizite semantische Datenverstärkungsmethode vor, die Transformationsrichtungen aus anderen Kategorien entlehnt. Da die Kovarianzmatrix jeder Kategorie die Merkmals-Transformationsrichtungen repräsentiert, können wir neue Richtungen aus ähnlichen Kategorien ableiten, um definitiv unterschiedliche Instanzen zu generieren. Konkret wird zunächst ein Backbone und ein Klassifikator an langen Schwanzverteilungsdaten trainiert. Anschließend wird für jede Kategorie eine Kovarianzmatrix geschätzt, und ein Wissensgraph wird aufgebaut, um die Beziehungen zwischen beliebigen Kategorien zu speichern. Schließlich werden die Tail-Stichproben adaptiv verbessert, indem Informationen aus allen ähnlichen Kategorien im Wissensgraphen propagiert werden. Experimentelle Ergebnisse auf CIFAR-100-LT, ImageNet-LT und iNaturalist 2018 belegen die Wirksamkeit der vorgeschlagenen Methode im Vergleich zu aktuellen State-of-the-Art-Verfahren.