HyperAIHyperAI

Command Palette

Search for a command to run...

Domänenverallgemeinerung unter Verwendung großer vortrainierter Modelle mit Mixture-of-Adapters

Gyuseong Lee Wooseok Jang Jinhyeon Kim Jaewoo Jung Seungryong Kim

Zusammenfassung

Die Entwicklung robuster visueller Modelle, die auch in Out-of-Distribution (OOD)-Szenarien gut abschneiden, ist eine zentrale Aufgabe für die praktische Anwendung von Modellen in realen Umgebungen. Trotz umfangreicher Forschung in diesem Bereich haben viele vorgeschlagene Methoden im Vergleich zur einfachsten Methode der empirischen Risikominimierung (ERM), die auf einem Benchmark mit begrenztem Suchraum für Hyperparameter evaluiert wurde, nur geringfügige Leistungsverbesserungen erzielt. In dieser Studie konzentrieren wir uns darauf, das Wissen großer vortrainierter Modelle zu nutzen, um die Bewältigung von OOD-Szenarien und Probleme der Domänenverallgemeinerung zu verbessern. Allerdings hat vorangegangene Forschung gezeigt, dass eine naiv durchgeführte Feinjustierung eines großen vortrainierten Modells die OOD-Robustheit beeinträchtigen kann. Daher setzen wir parameter-effiziente Feinjustierungstechniken (PEFT) ein, um die OOD-Robustheit effektiv zu bewahren, während wir mit großen Modellen arbeiten. Unsere umfangreichen Experimente und Analysen bestätigen, dass die effektivsten Ansätze die Ensembles verschiedener Modelle sowie eine Erhöhung der Skalierung des Vortrainings beinhalten. Als Ergebnis erreichen wir eine state-of-the-art-Leistung bei Aufgaben der Domänenverallgemeinerung. Unser Code und die Projektseite sind verfügbar unter: https://cvlab-kaist.github.io/MoA


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Domänenverallgemeinerung unter Verwendung großer vortrainierter Modelle mit Mixture-of-Adapters | Paper | HyperAI