HyperAIHyperAI

Command Palette

Search for a command to run...

ResMLP: Feedforward-Netzwerke zur Bildklassifikation mit dateneffizientem Training

Zusammenfassung

Wir stellen ResMLP vor, eine Architektur, die vollständig auf mehrschichtigen Perzeptronen für die Bildklassifikation basiert. Es handelt sich um ein einfaches Residual-Netzwerk, das abwechselnd (i) eine lineare Schicht verwendet, in der Bild-Patches unabhängig und identisch über alle Kanäle hinweg interagieren, und (ii) ein zweilagiges Feed-Forward-Netzwerk, in dem die Kanäle pro Patch unabhängig voneinander interagieren. Bei der Ausbildung mit einer modernen Trainingsstrategie, die umfassende Datenaugmentation und gegebenenfalls Distillation beinhaltet, erzielt es überraschend gute Ergebnisse hinsichtlich des Kompromisses aus Genauigkeit und Komplexität auf ImageNet. Zudem trainieren wir ResMLP-Modelle in einer selbstüberwachten Einstellung, um zusätzliche Annahmen durch die Verwendung eines beschrifteten Datensatzes zu vermeiden. Schließlich erreichen wir bei der Anpassung unseres Modells auf maschinelle Übersetzung überraschend gute Ergebnisse. Wir stellen vortrainierte Modelle sowie unseren Code, basierend auf der Timm-Bibliothek, zur Verfügung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp