HyperAIHyperAI
vor 17 Tagen

Neubewertung rekurrenter neuronaler Netze und weitere Verbesserungen für die Bildklassifikation

Nguyen Huu Phong, Bernardete Ribeiro
Neubewertung rekurrenter neuronaler Netze und weitere Verbesserungen für die Bildklassifikation
Abstract

Im Verlauf der langen Geschichte des maschinellen Lernens, die mehrere Jahrzehnte zurückreicht, wurden rekurrente neuronale Netzwerke (RNNs) hauptsächlich für sequenzielle Daten und Zeitreihen eingesetzt und in der Regel mit eindimensionalen Informationen. Selbst in einigen seltenen Studien zu zweidimensionalen Bildern dienen diese Netzwerke lediglich zur sequenziellen Lern- und Generierung von Daten, nicht jedoch zur Bilderkennung. In dieser Studie schlagen wir vor, ein RNN als zusätzliche Schicht bei der Gestaltung von Bilderkennungsmodellen zu integrieren. Zudem entwickeln wir end-to-end-Multimodell-Ensembles, die Expertenvorhersagen mithilfe mehrerer Modelle erzeugen. Darüber hinaus erweitern wir die Trainingsstrategie derart, dass unser Modell mit führenden Modellen vergleichbar performt und sogar auf mehreren anspruchsvollen Datensätzen die State-of-the-Art-Leistung erreicht (z. B. SVHN (0,99), Cifar-100 (0,9027) und Cifar-10 (0,9852)). Zudem erzielt unser Modell eine neue Bestleistung auf dem Surrey-Datensatz (0,949). Der Quellcode der in diesem Artikel vorgestellten Methoden ist unter https://github.com/leonlha/e2e-3m und http://nguyenhuuphong.me verfügbar.