HyperAIHyperAI
vor 11 Tagen

Generelle partielle Label-Lernung mittels Dualer bipartiter Graphen-Autoencoder

Brian Chen, Bo Wu, Alireza Zareian, Hanwang Zhang, Shih-Fu Chang
Generelle partielle Label-Lernung mittels Dualer bipartiter Graphen-Autoencoder
Abstract

Wir formulieren ein praktisches, jedoch herausforderndes Problem: General Partial Label Learning (GPLL). Im Vergleich zum traditionellen Partial Label Learning (PLL) lockert GPLL die Supervisionsannahme von der Instanz- auf die Gruppen-Ebene: 1) Eine Labelmenge teilweise beschriftet eine Gruppe von Instanzen, wobei die innerhalb der Gruppe bestehenden Instanz-Label-Verknüpfungen fehlen, und 2) es sind Kreuz-Gruppen-Verbindungen zulässig – Instanzen einer Gruppe können teilweise mit einer Labelmenge aus einer anderen Gruppe verknüpft sein. Diese mehrdeutige Gruppen-Ebene-Supervision ist realitätsnaher, da keine zusätzliche Instanz-Ebene-Annotation erforderlich ist, beispielsweise bei der Namenszuweisung von Gesichtern in Videos, wobei die Gruppe aus Gesichtern in einem Frame besteht, die durch eine Namensmenge im zugehörigen Caption annotiert sind. In diesem Artikel stellen wir ein neuartiges Graph Convolutional Network (GCN), namens Dual Bipartite Graph Autoencoder (DB-GAE), vor, um die Label-Abbildungsherausforderung im Rahmen von GPLL zu bewältigen. Zunächst nutzen wir die Kreuz-Gruppen-Korrelationen, um die Instanzgruppen als duale bipartite Graphen darzustellen: innerhalb-Gruppen- und Kreuz-Gruppen-Graphen, die sich gegenseitig ergänzen und so die Verknüpfungsambiguitäten lösen. Zweitens entwerfen wir einen GCN-Autoencoder, um diese Graphen zu kodieren und zu dekodieren, wobei die Dekodierungen als verfeinerte Ergebnisse betrachtet werden. Es sei bemerkt, dass DB-GAE selbstüberwacht und transduktiv ist, da sie ausschließlich auf der Gruppen-Ebene-Supervision basiert und keinen separaten Offline-Trainingsstadium benötigt. Umfassende Experimente auf zwei realen Datensätzen zeigen, dass DB-GAE den besten Baseline um absolut 0,159 im F1-Score und 24,8 % in der Genauigkeit deutlich übertrifft. Zudem bieten wir eine Analyse verschiedener Grade an Label-Ambiguität.

Generelle partielle Label-Lernung mittels Dualer bipartiter Graphen-Autoencoder | Neueste Forschungsarbeiten | HyperAI