Command Palette
Search for a command to run...
Mehraufgaben-CNN-Modell zur Attributvorhersage
Mehraufgaben-CNN-Modell zur Attributvorhersage
Abdulnabi Abrar H. Wang Gang Lu Jiwen Jia Kui
Zusammenfassung
Diese Arbeit stellt einen gemeinsamen Multi-Task-Lernansatz vor, um Attribute in Bildern mithilfe tiefer konvolutioneller neuronalen Netze (CNN) präziser vorherzusagen. Wir betrachten die Lernung binärer semantischer Attribute mittels eines Multi-Task-CNN-Modells, wobei jedes CNN jeweils ein einzelnes binäres Attribut vorhersagt. Der Multi-Task-Lernansatz ermöglicht es den CNN-Modellen, visuelles Wissen gleichzeitig über verschiedene Attributkategorien hinweg zu teilen. Jedes CNN erzeugt dabei spezifische Merkmalsdarstellungen für das jeweilige Attribut, und anschließend wenden wir den Multi-Task-Lernansatz auf diese Merkmale an, um die zugehörigen Attribute vorherzusagen. In unserem Multi-Task-Framework schlagen wir eine Methode vor, die die Gesamtparameter des Modells in eine latente Aufgabenmatrix und eine Kombinationsmatrix zu zerlegen. Darüber hinaus können unterrepräsentierte Klassifikatoren von gemeinsam genutzten Statistiken anderer Klassifikatoren profitieren, um ihre Leistung zu verbessern. Eine natürliche Gruppierung der Attribute wird angewandt, wobei Attribute innerhalb derselben Gruppe dazu ermutigt werden, mehr Wissen zu teilen. Gleichzeitig konkurrieren Attribute aus unterschiedlichen Gruppen im Allgemeinen miteinander und teilen daher weniger Wissen. Wir zeigen die Wirksamkeit unseres Ansatzes an zwei etablierten Attribut-Datensätzen.