HyperAIHyperAI
vor 2 Monaten

Mehrskalige Kontextaggregation durch dilatierte Faltungen

Fisher Yu; Vladlen Koltun
Mehrskalige Kontextaggregation durch dilatierte Faltungen
Abstract

Zustandsder-kunst-Modelle für semantische Segmentierung basieren auf Anpassungen von Faltungsnetzen, die ursprünglich für die Bildklassifizierung entwickelt wurden. Allerdings unterscheiden sich dichte Vorhersage und Bildklassifizierung strukturell. In dieser Arbeit entwickeln wir ein neues Modul für Faltungsnetze, das speziell für dichte Vorhersage konzipiert ist. Das vorgestellte Modul verwendet dilatierte Faltungen (dilated convolutions), um systematisch mehrskalige kontextuelle Informationen zu aggregieren, ohne Auflösung zu verlieren. Die Architektur basiert auf der Tatsache, dass dilatierte Faltungen eine exponentielle Erweiterung des Rezeptorfelds ohne Verlust an Auflösung oder Abdeckung unterstützen. Wir zeigen, dass das präsentierte Kontextmodul die Genauigkeit der zustandsder-kunst-semantischen Segmentierungssysteme erhöht. Zudem untersuchen wir die Anpassung von Bildklassifizierungsnetzen an dichte Vorhersage und demonstrieren, dass eine Vereinfachung des angepassten Netzes die Genauigkeit verbessern kann.

Mehrskalige Kontextaggregation durch dilatierte Faltungen | Neueste Forschungsarbeiten | HyperAI