HyperAIHyperAI
vor 2 Monaten

Sehr tiefe Faltungsnetze für die großmaßstäbliche Bilderkennung

Simonyan, Karen ; Zisserman, Andrew
Sehr tiefe Faltungsnetze für die großmaßstäbliche Bilderkennung
Abstract

In dieser Arbeit untersuchen wir den Einfluss der Tiefe von Faltungsnetzen auf ihre Genauigkeit im Kontext der großmaßstäblichen Bilderkennung. Unser Hauptbeitrag besteht in einer gründlichen Auswertung von Netzen mit zunehmender Tiefe unter Verwendung einer Architektur mit sehr kleinen (3x3) Faltungsfiltern, die zeigt, dass eine erhebliche Verbesserung gegenüber den bisherigen Konfigurationen durch das Erreichen von 16-19 Gewichtsschichten erreicht werden kann. Diese Ergebnisse bildeten die Grundlage unserer ImageNet-Challenge-2014-Einreichung, bei der unser Team den ersten und zweiten Platz in den Lokalisierungs- und Klassifikationsdisziplinen belegte. Wir zeigen außerdem, dass unsere Repräsentationen sich gut auf andere Datensätze übertragen lassen, wo sie Spitzenwerte erzielen. Unsere beiden besten ConvNet-Modelle haben wir öffentlich zugänglich gemacht, um weitere Forschungen zur Nutzung tiefer visueller Repräsentationen in der Computer Vision zu fördern.