Erweitern von Deep-Classifiern durch Polynomiale Neuronale Netzwerke

Tiefneuronale Netze waren der treibende Faktor für den Erfolg bei Klassifizierungsaufgaben, beispielsweise bei der Objekt- und Audiorerkennung. Durch eine Vielzahl kürzlich vorgeschlagener Architekturen wurden beeindruckende Ergebnisse und eine hohe Verallgemeinerungsfähigkeit erzielt, wobei die meisten dieser Architekturen scheinbar unverbunden erscheinen. In dieser Arbeit stellen wir die Untersuchung tiefer Klassifizierer unter einem einheitlichen Rahmen dar. Insbesondere drücken wir state-of-the-art-Architekturen (z. B. Residual- und Non-Local-Netze) in Form von Polynomen unterschiedlicher Grade der Eingabe aus. Unser Rahmen bietet Einblicke in die induktiven Vorurteile jedes Modells und ermöglicht natürliche Erweiterungen, die auf ihrer polynomialen Struktur basieren. Die Wirksamkeit der vorgeschlagenen Modelle wird anhand standardisierter Benchmarks für Bild- und Audiodatenklassifizierung evaluiert. Die Ausdruckskraft der vorgeschlagenen Modelle zeigt sich sowohl an einer verbesserten Modellleistung als auch an einer effektiven Modellkompression. Schließlich demonstrieren die durch diese Klassifizierung ermöglichten Erweiterungen Vorteile bei begrenzten Datenmengen und langen Schwanzverteilungen. Wir erwarten, dass diese Klassifizierung Brücken zwischen bisherigen, domänenspezifischen Architekturen schafft. Der Quellcode ist unter \url{https://github.com/grigorisg9gr/polynomials-for-augmenting-NNs} verfügbar.