HyperAIHyperAI
vor einem Monat

Res2Net: Eine Neue Multiskalen-Backbone-Architektur

Shang-Hua Gao; Ming-Ming Cheng; Kai Zhao; Xin-Yu Zhang; Ming-Hsuan Yang; Philip Torr
Res2Net: Eine Neue Multiskalen-Backbone-Architektur
Abstract

Die Darstellung von Merkmalen auf mehreren Skalen ist für zahlreiche visuelle Aufgaben von großer Bedeutung. Neuere Fortschritte bei den Backbonen von Faltungsneuronalen Netzen (CNNs) zeigen kontinuierlich eine stärkere Fähigkeit zur Multi-Skalendarstellung, was zu konsistenten Leistungssteigerungen in einer Vielzahl von Anwendungen führt. Dennoch stellen die meisten existierenden Methoden die Multi-Skalenmerkmale in schichtweise Art und Weise dar. In dieser Arbeit schlagen wir einen neuen Baustein für CNNs vor, nämlich Res2Net, indem wir hierarchische residualartige Verbindungen innerhalb eines einzelnen Residualblocks konstruieren. Res2Net stellt Multi-Skalenmerkmale auf granulare Ebene dar und erhöht den Rezeptivbereichsbereich für jede Netzwerk-Schicht. Der vorgeschlagene Res2Net-Baustein kann in moderne Backbon-CNN-Modelle integriert werden, wie z.B. ResNet, ResNeXt und DLA. Wir evaluieren den Res2Net-Baustein an diesen Modellen und zeigen konsistente Leistungsverbesserungen gegenüber den Basismodellen auf weit verbreiteten Datensätzen, wie z.B. CIFAR-100 und ImageNet. Weitere Abschleifstudien und experimentelle Ergebnisse bei repräsentativen Computer-Vision-Aufgaben, d.h. Objekterkennung, Klassifikationsaktivitätsabbildung (Class Activation Mapping) und Salienzobjekterkennung, bestätigen die Überlegenheit des Res2Net gegenüber den modernsten Basismethoden. Der Quellcode und die trainierten Modelle sind unter https://mmcheng.net/res2net/ verfügbar.

Res2Net: Eine Neue Multiskalen-Backbone-Architektur | Neueste Forschungsarbeiten | HyperAI