HyperAIHyperAI
vor 2 Monaten

Fordern Verschiedene Verfolgungsaufgaben Verschiedene Erscheinungsmodelle?

Zhongdao Wang; Hengshuang Zhao; Ya-Li Li; Shengjin Wang; Philip H.S. Torr; Luca Bertinetto
Fordern Verschiedene Verfolgungsaufgaben Verschiedene Erscheinungsmodelle?
Abstract

Die Verfolgung von Objekten von Interesse in Videos ist eines der beliebtesten und am weitesten anwendbaren Probleme im Bereich der Computer Vision. Im Laufe der Jahre hat jedoch eine Art kambrianische Explosion an Anwendungsfällen und Benchmarks das Problem in eine Vielzahl unterschiedlicher experimenteller Aufsätze zerstückelt. Als Folge davon ist auch die Literatur fragmentiert, und neue Ansätze, die von der Gemeinschaft vorgeschlagen werden, sind in der Regel auf ein spezifisches Setup spezialisiert. Um zu verstehen, inwieweit diese Spezialisierung notwendig ist, präsentieren wir in dieser Arbeit UniTrack, eine Lösung, die fünf verschiedene Aufgaben innerhalb desselben Framework bearbeitet. UniTrack besteht aus einem einzigen und aufgabenunabhängigen Erscheinungsmodell (appearance model), das überwacht oder selbstüberwacht gelernt werden kann, sowie mehreren „Köpfen“ (heads), die einzelne Aufgaben adressieren und keine Trainingsphase erfordern. Wir zeigen, wie die meisten Verfolgungsaufgaben innerhalb dieses Frameworks gelöst werden können und dass dasselbe Erscheinungsmodell erfolgreich verwendet werden kann, um Ergebnisse zu erzielen, die mit den spezialisierten Methoden für die meisten betrachteten Aufgaben wettbewerbsfähig sind. Das Framework ermöglicht es uns zudem, Erscheinungsmodelle zu analysieren, die mit den neuesten selbstüberwachten Methoden erhalten wurden, sodass ihre Bewertung und Vergleich auf eine größere Vielfalt wichtiger Probleme erweitert wird.

Fordern Verschiedene Verfolgungsaufgaben Verschiedene Erscheinungsmodelle? | Neueste Forschungsarbeiten | HyperAI