Low-Shot-Lernen mit groß angelegter Diffusion

Dieses Papier behandelt das Problem der Inferenz von Bildetiketten aus Bildern, wenn während des Trainings nur wenige annotierte Beispiele zur Verfügung stehen. Diese Situation wird oft als Low-Shot-Lernen bezeichnet, wobei ein üblicher Ansatz darin besteht, die letzten paar Schichten eines auf separaten Klassen trainierten Faltungsneuronalen Netzes (Convolutional Neural Network) neu zu trainieren, für die zahlreiche Trainingsbeispiele vorhanden sind. Wir betrachten eine semi-überwachte Einstellung, die auf einer großen Sammlung von Bildern basiert, um die Verbreitung von Etiketten zu unterstützen. Dies ist durch den Einsatz jüngster Fortschritte bei der Konstruktion von Large-Scale Ähnlichkeitsgraphen möglich.Wir zeigen, dass trotz seiner konzeptuellen Einfachheit die Skalierung der Labelpropagation auf Hunderte Millionen Bilder zu einem Stand der Technik gehörende Genauigkeit im Bereich des Low-Shot-Lernens führt.