HyperAIHyperAI
vor 2 Monaten

Verbesserung der Few-Shot-Bildklassifizierung durch lernfähige Multi-Skalen-Embedding und Aufmerksamkeitsmechanismen

Askari, Fatemeh ; Fateh, Amirreza ; Mohammadi, Mohammad Reza
Verbesserung der Few-Shot-Bildklassifizierung durch lernfähige Multi-Skalen-Embedding und Aufmerksamkeitsmechanismen
Abstract

Im Kontext der Few-Shot-Klassifikation ist das Ziel, einen Klassifizierer mit einer begrenzten Anzahl von Stichproben zu trainieren, während gleichzeitig eine zufriedenstellende Leistung aufrechterhalten wird. Traditionelle metrische Methoden zeigen jedoch bestimmte Einschränkungen bei der Erreichung dieses Ziels. Diese Methoden basieren in der Regel auf einem einzelnen Distanzwert zwischen dem Abfrage-Feature und dem Support-Feature, wodurch der Beitrag flacher Features übersehen wird. Um dieser Herausforderung zu begegnen, schlagen wir in diesem Artikel einen neuen Ansatz vor. Unser Ansatz besteht darin, ein Multi-Output-Embedding-Netzwerk zu nutzen, das Stichproben in unterschiedliche Featureräume abbildet. Die vorgeschlagene Methode extrahiert Featurevektoren in verschiedenen Phasen, was es dem Modell ermöglicht, sowohl globale als auch abstrakte Features zu erfassen. Durch die Nutzung dieser diversen Featureräume verbessert unser Modell seine Leistung. Zudem führt die Anwendung eines Selbst-Aufmerksamkeitsmechanismus (Self-Attention Mechanism) zur Verfeinerung der Features in jeder Phase zu noch robusteren Darstellungen und einer weiter verbesserten Gesamtleistung. Die Zuweisung lernfähiger Gewichte (Learnable Weights) zu jeder Phase hat die Leistung und die Ergebnisse erheblich gesteigert. Wir haben umfassende Evaluierungen auf den Datensätzen MiniImageNet und FC100 durchgeführt, insbesondere in den Szenarien 5-Way 1-Shot und 5-Way 5-Shot. Zusätzlich haben wir Cross-Domain-Aufgaben über acht Benchmark-Datensätze durchgeführt und hohe Genauigkeit in den Testdomänen erzielt. Diese Evaluierungen zeigen die Effektivität unserer vorgeschlagenen Methode im Vergleich zu den neuesten Stand der Technik-Ansätzen (State-of-the-Art Approaches). https://github.com/FatemehAskari/MSENet