HyperAIHyperAI
vor 15 Tagen

Keep Learning: Selbstüberwachtes Meta-Lernen zum Lernen aus Inferenz

{Sai Chetan Chinthakindi, Akhil Kedia}
Keep Learning: Selbstüberwachtes Meta-Lernen zum Lernen aus Inferenz
Abstract

Ein verbreiteter Ansatz in vielen maschinellen Lernverfahren besteht darin, ein Modell zunächst auf großen, unbeschrifteten Datensätzen mittels selbstüberwachten Lernverfahren zu trainieren, bevor es auf nachgeschaltete Aufgaben feinabgestimmt wird, um die Leistung weiter zu verbessern. Ein neuer Ansatz für Sprachmodellierung, der sogenannte dynamische Evaluation, feinabstimmt ein bereits trainiertes Modell während der Inferenz mithilfe trivialer, direkt vorhandener Ground-Truth-Labels, wodurch eine erhebliche Leistungssteigerung erzielt wird. Dieser Ansatz lässt sich jedoch nicht direkt auf Klassifikationsaufgaben übertragen, da während der Inferenz keine Ground-Truth-Labels verfügbar sind. Um dieses Problem zu lösen, schlagen wir vor, Selbsttraining einzusetzen und die Verlustfunktion aus den eigenen klassenbalancierten Vorhersagen des Modells (sogenannte Pseudolabels) zurückzupropagieren, wobei wir den Reptile-Algorithmus aus dem Meta-Lernen adaptieren und eine induktive Bias hin zu vortrainierten Gewichten nutzen, um die Generalisierungsfähigkeit zu verbessern. Unser Verfahren steigert die Leistung standardmäßiger Backbone-Modelle wie BERT, Electra und ResNet-50 auf einer Vielzahl von Aufgaben – beispielsweise bei der Fragebeantwortung auf SQuAD und NewsQA, der Benchmark-Aufgabe SuperGLUE, der Auswahl von Gesprächsantworten im Ubuntu Dialog Corpus v2.0 sowie der Bildklassifikation auf MNIST und ImageNet – ohne dass die zugrundeliegenden Modelle verändert werden müssen. Unser vorgeschlagener Ansatz übertrifft frühere Ansätze, ermöglicht selbstüberwachtes Feinabstimmen während der Inferenz beliebiger Klassifikationsmodelle zur besseren Anpassung an Zielbereiche, lässt sich leicht auf jedes Modell anwenden und ist zudem effektiv in Online- und Transfer-Lern-Szenarien.

Keep Learning: Selbstüberwachtes Meta-Lernen zum Lernen aus Inferenz | Neueste Forschungsarbeiten | HyperAI