HyperAIHyperAI
vor 2 Monaten

Verbesserte Anpassung zur Testzeit für die Domänenverallgemeinerung

Chen, Liang ; Zhang, Yong ; Song, Yibing ; Shan, Ying ; Liu, Lingqiao
Verbesserte Anpassung zur Testzeit für die Domänenverallgemeinerung
Abstract

Die Hauptausforderung bei der Domänenverallgemeinerung (Domain Generalization, DG) besteht darin, das Verteilungsverschiebungsproblem (Distribution Shift Problem) zwischen den Trainings- und Testdaten zu bewältigen. Neuere Studien deuten darauf hin, dass die Testzeittrainierung (Test-Time Training, TTT), die das gelernte Modell mit Testdaten anpasst, eine vielversprechende Lösung für dieses Problem sein könnte. Im Allgemeinen hängt die Leistung einer TTT-Strategie von zwei Hauptfaktoren ab: der Auswahl eines geeigneten unterstützenden TTT-Aufgabens für die Aktualisierung und der Identifizierung verlässlicher Parameter, die während der Testphase aktualisiert werden sollen. Sowohl frühere Arbeiten als auch unsere Experimente zeigen, dass TTT das gelernte Modell nicht verbessern, sondern schädigen kann, wenn diese beiden Faktoren nicht angemessen berücksichtigt werden. Diese Arbeit behandelt diese beiden Faktoren durch den Vorschlag einer verbesserten Testzeitadaptierungsmethode (Improved Test-Time Adaptation, ITTA). Erstens schlagen wir anstelle einer heuristisch definierten Nebenzielsetzung einen lernfähigen Konsistenzerhaltungsverlust (Consistency Loss) für die TTT-Aufgabe vor, der lernfähige Parameter enthält, die auf eine bessere Anpassung zwischen unserer TTT-Aufgabe und der Hauptvorhersageaufgabe ausgerichtet werden können. Zweitens führen wir zusätzliche adaptive Parameter für das trainierte Modell ein und schlagen vor, nur diese adaptiven Parameter während der Testphase zu aktualisieren. Durch umfangreiche Experimente zeigen wir, dass die vorgeschlagenen beiden Strategien förderlich für das gelernte Modell sind (siehe Abbildung 1), und dass ITTA eine überlegene Leistung im Vergleich zu aktuellen Stand-der-Kunst-Methoden auf mehreren DG-Benchmarks erzielen kann. Der Quellcode ist unter https://github.com/liangchen527/ITTA verfügbar.

Verbesserte Anpassung zur Testzeit für die Domänenverallgemeinerung | Neueste Forschungsarbeiten | HyperAI