HyperAIHyperAI

Command Palette

Search for a command to run...

Verbesserung der visuellen Repräsentationslernung durch perceptuelles Verständnis

Samyakh Tukra Frederick Hoffman Ken Chatfield

Zusammenfassung

Wir präsentieren eine Erweiterung von Masked Autoencoders (MAE), die die von dem Modell erlernten Darstellungen verbessert, indem sie explizit die Entwicklung höherer, szenenbezogener Merkmale fördert. Dies erreichen wir durch: (i) die Einführung eines Perzeptionsähnlichkeitsbegriffs zwischen generierten und echten Bildern sowie (ii) die Integration mehrerer Techniken aus dem Bereich des adversarialen Trainings, darunter Multi-Scale-Training und adaptive Diskriminatoren-Augmentation. Die Kombination dieser Ansätze führt nicht nur zu einer verbesserten Pixel-Rekonstruktion, sondern auch zu Darstellungen, die anscheinend feinere, höherstufige Details innerhalb der Bilder erfassen. Konsequenterweise zeigen wir, dass unsere Methode, Perceptual MAE, bei nachgeschalteten Aufgaben eine bessere Leistung erzielt und damit frühere Ansätze übertrifft. Wir erreichen eine Top-1-Accuracy von 78,1 % bei linearer Probing auf ImageNet-1K und bis zu 88,1 % bei Fine-Tuning, mit vergleichbaren Ergebnissen für andere nachgeschaltete Aufgaben – alles ohne Verwendung zusätzlicher vortrainierter Modelle oder Daten.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp