HyperAIHyperAI
vor 7 Tagen

RF-Next: Effiziente Receptive Field-Suche für Convolutional Neural Networks

Shanghua Gao, Zhong-Yu Li, Qi Han, Ming-Ming Cheng, Liang Wang
RF-Next: Effiziente Receptive Field-Suche für Convolutional Neural Networks
Abstract

Die zeitlichen/raumlichen Rezeptivfelder von Modellen spielen eine entscheidende Rolle bei sequenziellen bzw. raumlichen Aufgaben. Große Rezeptivfelder ermöglichen die Erfassung langfristiger Beziehungen, während kleine Rezeptivfelder helfen, lokale Details zu erfassen. Bisherige Methoden konstruieren Modelle mit handkodierten Rezeptivfeldern in den einzelnen Schichten. Können wir effektiv Rezeptivfeldkombinationen suchen, um handkodierte Muster zu ersetzen? Um diese Frage zu beantworten, schlagen wir einen global-zu-lokalen Suchansatz vor, um bessere Rezeptivfeldkombinationen zu finden. Unser Suchansatz nutzt sowohl eine globale Suche, um grobe Kombinationen zu identifizieren, als auch eine lokale Suche, um die Rezeptivfeldkombinationen weiter zu verfeinern. Die globale Suche ermittelt mögliche grobe Kombinationen jenseits menschlich konzipierter Muster. Auf Basis dieser globalen Suche stellen wir ein erwartungsgesteuertes, iteratives lokales Suchverfahren vor, das die Kombinationen effizient verfeinert. Unsere RF-Next-Modelle, die die Rezeptivfeldsuche in verschiedene Architekturen integrieren, verbessern die Leistung auf zahlreichen Aufgaben, beispielsweise bei der zeitlichen Aktionssegmentierung, Objekterkennung, Instanzsegmentierung und Sprachsynthese. Der Quellcode ist öffentlich unter http://mmcheng.net/rfnext verfügbar.

RF-Next: Effiziente Receptive Field-Suche für Convolutional Neural Networks | Neueste Forschungsarbeiten | HyperAI