HyperAIHyperAI
vor 8 Tagen

Nested Collaborative Learning für die long-tailed visuelle Erkennung

Jun Li, Zichang Tan, Jun Wan, Zhen Lei, Guodong Guo
Nested Collaborative Learning für die long-tailed visuelle Erkennung
Abstract

Die auf dem langen Schwanz-Datensatz trainierten Netzwerke weisen trotz identischer Trainingsbedingungen erhebliche Unterschiede auf, was die große Unsicherheit im Bereich des langen Schwanz-Lernens verdeutlicht. Um diese Unsicherheit zu verringern, schlagen wir Nested Collaborative Learning (NCL) vor, ein Ansatz, der das Problem durch die kooperative Lernung mehrerer Experten gemeinsam angeht. NCL besteht aus zwei zentralen Komponenten: Nested Individual Learning (NIL) und Nested Balanced Online Distillation (NBOD), die jeweils auf der individuellen überwachten Lernung für jede einzelne Expertin und dem Wissenstransfer zwischen mehreren Experten fokussieren. Um die Repräsentationen umfassender zu lernen, werden sowohl NIL als auch NBOD in einer geschachtelten Form formuliert, bei der das Lernen nicht nur aus einer globalen Perspektive über alle Kategorien hinweg, sondern auch aus einer partiellen Perspektive auf bestimmte schwierige Kategorien erfolgt. Im Hinblick auf das Lernen aus der partiellen Perspektive identifizieren wir speziell die negativen Kategorien mit hohen vorhergesagten Werten als schwierige Kategorien, indem wir eine vorgeschlagene Hard Category Mining (HCM)-Methode einsetzen. In NCL sind die Lernprozesse aus beiden Perspektiven geschachtelt, stark miteinander verknüpft und ergänzen sich gegenseitig, wodurch das Netzwerk sowohl globale und robuste Merkmale als auch fein abgestimmte Unterscheidungsfähigkeiten erlernen kann. Zudem wird zusätzliche Selbstüberwachung zur Verbesserung der Merkmalsdarstellung genutzt. Umfangreiche Experimente belegen die Überlegenheit unseres Ansatzes: Unabhängig davon, ob ein einzelnes Modell oder eine Ensemble-Methode verwendet wird, übertrifft unsere Methode die derzeitigen State-of-the-Art-Verfahren.

Nested Collaborative Learning für die long-tailed visuelle Erkennung | Neueste Forschungsarbeiten | HyperAI