Command Palette
Search for a command to run...
Sehr tiefe konvolutionale Netzwerke für die Erkennung großer Bilder
Sehr tiefe konvolutionale Netzwerke für die Erkennung großer Bilder
Simonyan Karen Zisserman Andrew
Zusammenfassung
In dieser Arbeit untersuchen wir den Einfluss der Tiefe von Faltungsnetzwerken auf ihre Genauigkeit im Kontext der Großskalen-Bilderkennung. Unser Hauptbeitrag ist eine gründliche Evaluation von Netzwerken mit zunehmender Tiefe unter Verwendung einer Architektur mit äußerst kleinen (3×3) Faltungsfiltern, die zeigt, dass durch eine Erhöhung der Tiefe auf 16 bis 19 Gewichtsschichten eine erhebliche Verbesserung gegenüber den vorherigen Stand der Technik erzielt werden kann. Diese Erkenntnisse bildeten die Grundlage unserer Teilnahme am ImageNet-Challenge 2014, bei der unser Team jeweils den ersten und zweiten Platz in den Kategorien Lokalisierung und Klassifizierung erreichte. Außerdem zeigen wir, dass unsere Darstellungen gut auf andere Datensätze generalisieren und dort führende Ergebnisse erzielen. Wir haben unsere beiden besten Leistungsmodelle als ConvNet öffentlich zugänglich gemacht, um die weitere Forschung zur Nutzung tiefer visueller Darstellungen in der Computer Vision zu fördern.