Sequentielle Graphen-Convolutionale Netzwerke für aktives Lernen

Wir stellen einen neuartigen pool-basierten Active-Learning-Framework vor, der auf einem sequenziellen Graph Convolution Network (GCN) aufbaut. Jedes Bild aus einem Datensatzpool wird als Knoten im Graphen dargestellt, während die Kanten deren Ähnlichkeiten kodieren. Ausgehend von einer kleinen Anzahl zufällig ausgewählter Bilder als Startbeispiel für die Beschriftung lernen wir die Parameter des Graphen, um beschriftete von unbeschrifteten Knoten durch Minimierung des binären Kreuzentropieverlustes zu unterscheiden. Der GCN führt Nachrichtenübertragungsoperationen zwischen den Knoten durch, wodurch ähnliche Repräsentationen stark verbundener Knoten induziert werden. Wir nutzen diese Eigenschaften des GCN, um unbeschriftete Beispiele auszuwählen, die ausreichend von den beschrifteten abweichen. Hierzu nutzen wir die Knoten-Embeddings des Graphen sowie deren Vertrauenswerte und adaptieren Sampling-Techniken wie CoreSet und unsicherheitsbasierte Methoden, um Knoten abzufragen. Die Etikettierung der neu abgefragten Knoten wird von „unbeschriftet“ auf „beschriftet“ umgekehrt, der Lerner wird neu trainiert, um die Aufgabe im nachgeschalteten System zu optimieren, und der Graph wird entsprechend seiner modifizierten Zielfunktion neu angepasst. Dieser Prozess wird innerhalb eines festgelegten Budgets fortgesetzt. Wir evaluieren unsere Methode an sechs verschiedenen Benchmarks: vier realen Datensätzen für Bildklassifikation, einem Datensatz zur Tiefenbasierten Handpose-Schätzung und einem synthetischen Datensatz für RGB-Bildklassifikation. Unsere Methode übertrifft mehrere konkurrierende Baselines wie VAAL, Learning Loss und CoreSet und erreicht auf mehreren Anwendungen den neuen Stand der Technik. Die Implementierung ist hier verfügbar: https://github.com/razvancaramalau/Sequential-GCN-for-Active-Learning