HyperAIHyperAI
vor 8 Tagen

Selbstüberwachte Aggregation vielfältiger Experte für testagnostische Long-Tailed-Anerkennung

Yifan Zhang, Bryan Hooi, Lanqing Hong, Jiashi Feng
Selbstüberwachte Aggregation vielfältiger Experte für testagnostische Long-Tailed-Anerkennung
Abstract

Bekannte Methoden zur langen Schwanz-Erkennung zielen darauf ab, klassenbalancierte Modelle aus langen Schwanz-Daten zu trainieren und gehen in der Regel davon aus, dass die Modelle auf einer gleichmäßigen Test-Klassenverteilung evaluiert werden. In der Praxis verletzen jedoch die tatsächlichen Test-Klassenverteilungen diese Annahme häufig (z. B. durch eine lange Schwanz- oder sogar umgekehrte lange Schwanz-Verteilung), was dazu führen kann, dass bestehende Ansätze in realen Anwendungen versagen. In diesem Artikel untersuchen wir eine praktischere, jedoch herausforderndere Aufgabe, die sogenannte test-agnostische lange Schwanz-Erkennung, bei der die Trainings-Klassenverteilung langen Schwanz aufweist, die Test-Klassenverteilung jedoch agnostisch ist und nicht notwendigerweise gleichmäßig sein muss. Neben dem Problem der Klassenungleichgewichtigkeit stellt diese Aufgabe eine weitere Herausforderung dar: Die Klassenverteilungsverschiebung zwischen Trainings- und Testdaten ist unbekannt. Um diese Aufgabe zu bewältigen, schlagen wir einen neuartigen Ansatz vor, genannt Self-supervised Aggregation of Diverse Experts (SADE), der aus zwei Strategien besteht: (i) eine neue, fähigkeitsdiverse Expertenlernstrategie, die mehrere Experten aus einem einzigen, stationären langen Schwanz-Datensatz trainiert, um jeweils unterschiedliche Klassenverteilungen separat zu bewältigen; (ii) eine neuartige Expertenaggregation im Testzeitpunkt, die selbstüberwachtes Lernen nutzt, um die gelernten mehreren Experten zu kombinieren, um unbekannte Test-Klassenverteilungen zu handhaben. Theoretisch zeigen wir, dass unsere selbstüberwachte Strategie eine beweisbare Fähigkeit besitzt, test-agnostische Klassenverteilungen zu simulieren. Versprechende empirische Ergebnisse belegen die Wirksamkeit unseres Ansatzes sowohl bei der klassischen als auch bei der test-agnostischen langen Schwanz-Erkennung. Der Quellcode ist unter \url{https://github.com/Vanint/SADE-AgnosticLT} verfügbar.

Selbstüberwachte Aggregation vielfältiger Experte für testagnostische Long-Tailed-Anerkennung | Neueste Forschungsarbeiten | HyperAI