Wettbewerbsfähige Mehrskalen-Faltung

In dieser Arbeit stellen wir ein neues Modul für tiefe Faltungsneuronale Netze (ConvNet) vor, das die Konkurrenz unter einer Reihe von mehrskaligen Faltungsfiltern fördert. Dieses neue Modul ist inspiriert vom Inception-Modul, bei dem wir den ursprünglichen kooperativen Pooling-Schritt (bestehend aus der Verkettung der Ausgaben der mehrskaligen Filter) durch einen wettbewerbsorientierten Pooling-Schritt ersetzen, der durch eine Maxout-Aktivierungseinheit repräsentiert wird. Diese Erweiterung verfolgt die folgenden zwei Ziele: 1) Die Auswahl der maximalen Reaktion unter den mehrskaligen Filtern verhindert die Ko-Adaption der Filter und ermöglicht die Bildung mehrerer Untermodelle innerhalb desselben Modells, was sich als förderlich für das Training komplexer Lernprobleme erwiesen hat; und 2) Die Maxout-Einheit reduziert die Dimensionalität der Ausgaben der mehrskaligen Filter. Wir zeigen, dass die Verwendung unseres vorgeschlagenen Moduls in typischen tiefen ConvNets Klassifikationsresultate erzeugt, die entweder besser sind oder sich mit dem Stand der Technik auf den folgenden Benchmark-Datensätzen vergleichen lassen: MNIST, CIFAR-10, CIFAR-100 und SVHN.