HyperAIHyperAI

Command Palette

Search for a command to run...

Selbstüberwachte Aggregation vielfältiger Experte für testagnostische Long-Tailed-Anerkennung

Yifan Zhang Bryan Hooi Lanqing Hong Jiashi Feng

Zusammenfassung

Bekannte Methoden zur langen Schwanz-Erkennung zielen darauf ab, klassenbalancierte Modelle aus langen Schwanz-Daten zu trainieren und gehen in der Regel davon aus, dass die Modelle auf einer gleichmäßigen Test-Klassenverteilung evaluiert werden. In der Praxis verletzen jedoch die tatsächlichen Test-Klassenverteilungen diese Annahme häufig (z. B. durch eine lange Schwanz- oder sogar umgekehrte lange Schwanz-Verteilung), was dazu führen kann, dass bestehende Ansätze in realen Anwendungen versagen. In diesem Artikel untersuchen wir eine praktischere, jedoch herausforderndere Aufgabe, die sogenannte test-agnostische lange Schwanz-Erkennung, bei der die Trainings-Klassenverteilung langen Schwanz aufweist, die Test-Klassenverteilung jedoch agnostisch ist und nicht notwendigerweise gleichmäßig sein muss. Neben dem Problem der Klassenungleichgewichtigkeit stellt diese Aufgabe eine weitere Herausforderung dar: Die Klassenverteilungsverschiebung zwischen Trainings- und Testdaten ist unbekannt. Um diese Aufgabe zu bewältigen, schlagen wir einen neuartigen Ansatz vor, genannt Self-supervised Aggregation of Diverse Experts (SADE), der aus zwei Strategien besteht: (i) eine neue, fähigkeitsdiverse Expertenlernstrategie, die mehrere Experten aus einem einzigen, stationären langen Schwanz-Datensatz trainiert, um jeweils unterschiedliche Klassenverteilungen separat zu bewältigen; (ii) eine neuartige Expertenaggregation im Testzeitpunkt, die selbstüberwachtes Lernen nutzt, um die gelernten mehreren Experten zu kombinieren, um unbekannte Test-Klassenverteilungen zu handhaben. Theoretisch zeigen wir, dass unsere selbstüberwachte Strategie eine beweisbare Fähigkeit besitzt, test-agnostische Klassenverteilungen zu simulieren. Versprechende empirische Ergebnisse belegen die Wirksamkeit unseres Ansatzes sowohl bei der klassischen als auch bei der test-agnostischen langen Schwanz-Erkennung. Der Quellcode ist unter \url{https://github.com/Vanint/SADE-AgnosticLT} verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Selbstüberwachte Aggregation vielfältiger Experte für testagnostische Long-Tailed-Anerkennung | Paper | HyperAI