HyperAIHyperAI
vor 2 Monaten

PACTran: PAC-Bayes'sche Metriken zur Schätzung der Übertragbarkeit vortrainierter Modelle auf Klassifizierungsaufgaben

Nan Ding; Xi Chen; Tomer Levinboim; Beer Changpinyo; Radu Soricut
PACTran: PAC-Bayes'sche Metriken zur Schätzung der Übertragbarkeit vortrainierter Modelle auf Klassifizierungsaufgaben
Abstract

Mit der zunehmenden Fülle vortrainierter Modelle in den letzten Jahren gewinnt das Problem der Auswahl des besten vortrainierten Checkpoints für eine bestimmte Downstream-Klassifizierungsaufgabe an Bedeutung. Obwohl in letzter Zeit mehrere Methoden vorgeschlagen wurden, um das Auswahlproblem zu lösen (z.B. LEEP, H-Score), greifen diese Methoden auf Heuristiken zurück, die nicht gut durch die Lerntheorie begründet sind. In dieser Arbeit stellen wir PACTran vor, eine theoriebasierte Familie von Metriken zur Auswahl vortrainierter Modelle und zur Messung ihrer Transferierbarkeit. Zunächst zeigen wir, wie man PACTran-Metriken aus der optimalen PAC-Bayes'schen Schranke unter Berücksichtigung des Transfer-Lernens ableiten kann. Anschließend bewerten wir drei Instanzen von PACTran-Metriken anhand einer Reihe von Visionstasks (VTAB) sowie eines sprach- und bildbasierten Tasks (OKVQA). Eine Analyse der Ergebnisse zeigt, dass PACTran im Vergleich zu bestehenden Selektionsmethoden ein konsistenteres und effektiveres Maß für die Transferierbarkeit ist.

PACTran: PAC-Bayes'sche Metriken zur Schätzung der Übertragbarkeit vortrainierter Modelle auf Klassifizierungsaufgaben | Neueste Forschungsarbeiten | HyperAI