HyperAIHyperAI
vor 2 Monaten

Adaptives Posteriors Lernen: Few-Shot-Lernen mit einem erstaunungsbasierten Speichermodul

Tiago Ramalho; Marta Garnelo
Adaptives Posteriors Lernen: Few-Shot-Lernen mit einem erstaunungsbasierten Speichermodul
Abstract

Die Fähigkeit, aus wenigen Beobachtungen schnell zu generalisieren, ist für intelligente Systeme entscheidend. In dieser Arbeit stellen wir APL vor, einen Algorithmus, der Wahrscheinlichkeitsverteilungen durch das Merken der überraschendsten Beobachtungen approximiert, die er getroffen hat. Diese früheren Beobachtungen werden aus einem externen Speichermodul abgerufen und von einem Dekodernetzwerk verarbeitet, das Informationen aus verschiedenen Speicherplätzen kombinieren kann, um eine Generalisierung über den direkten Abruf hinaus zu ermöglichen. Wir zeigen, dass dieser Algorithmus bei kleinerem Speicheraufwand genauso gut wie die aktuellen Baseline-Methoden in Few-Shot-Klassifikationsbenchmarks abschneidet. Darüber hinaus ermöglicht seine Speicherkompression ihm, auf Tausende unbekannter Labels zu skalieren. Schließlich führen wir eine Meta-Lern-Aufgabe ein, die anspruchsvoller ist als die direkte Klassifikation. In diesem Szenario ist APL in der Lage, durch deduktives Denken mit weniger als einem Beispiel pro Klasse zu generalisieren.