HyperAIHyperAI
vor 17 Tagen

Vision Eagle Attention: eine neue Perspektive zur Weiterentwicklung der Bildklassifikation

Mahmudul Hasan
Vision Eagle Attention: eine neue Perspektive zur Weiterentwicklung der Bildklassifikation
Abstract

Bei computersehenbasierten Aufgaben ist die Fähigkeit, sich auf relevante Bereiche innerhalb eines Bildes zu konzentrieren, entscheidend für die Verbesserung der Modellleistung – insbesondere dann, wenn wichtige Merkmale klein, subtil oder räumlich verteilt sind. Konvolutionale Neuronale Netze (CNNs) behandeln typischerweise alle Bildregionen gleich, was zu ineffizientem Merkmalsextraktionsprozess führen kann. Um dieser Herausforderung zu begegnen, habe ich Vision Eagle Attention eingeführt, einen neuartigen Aufmerksamkeitsmechanismus, der die Extraktion visueller Merkmale durch konvolutionale räumliche Aufmerksamkeit verbessert. Das Modell wendet Konvolutionen an, um lokale räumliche Merkmale zu erfassen, und generiert eine Aufmerksamkeitskarte, die gezielt die informativsten Bereiche des Bildes hervorhebt. Dieser Aufmerksamkeitsmechanismus ermöglicht es dem Modell, sich auf diskriminative Merkmale zu konzentrieren, während irrelevantes Hintergrundinformation unterdrückt wird. Ich habe Vision Eagle Attention in eine leichte ResNet-18-Architektur integriert und gezeigt, dass diese Kombination ein effizientes und leistungsstarkes Modell ergibt. Die Leistung des vorgeschlagenen Modells wurde anhand dreier weit verbreiteter Benchmark-Datensätze evaluiert: FashionMNIST, Intel Image Classification und OracleMNIST, wobei der Fokus auf der Bildklassifikation lag. Experimentelle Ergebnisse zeigen, dass der vorgeschlagene Ansatz die Klassifizierungsgenauigkeit verbessert. Zudem lässt sich diese Methode potenziell auf andere visuelle Aufgaben wie Objekterkennung, Segmentierung und visuelle Verfolgung erweitern und bietet eine rechnerisch effiziente Lösung für eine Vielzahl von anwendungsbasierten Vision-Anwendungen. Der Quellcode ist verfügbar unter: https://github.com/MahmudulHasan11085/Vision-Eagle-Attention.git

Vision Eagle Attention: eine neue Perspektive zur Weiterentwicklung der Bildklassifikation | Neueste Forschungsarbeiten | HyperAI