HyperAIHyperAI
vor 2 Monaten

Sie lernen nur eine Abfrage: Das Lernen einer einheitlichen menschlichen Abfrage für die einstufige Mehrpersonen-Mehraufgaben-Wahrnehmung

Jin, Sheng ; Li, Shuhuai ; Li, Tong ; Liu, Wentao ; Qian, Chen ; Luo, Ping
Sie lernen nur eine Abfrage: Das Lernen einer einheitlichen menschlichen Abfrage für die einstufige Mehrpersonen-Mehraufgaben-Wahrnehmung
Abstract

Menschenzentrierte Wahrnehmung (z.B. Detektion, Segmentierung, Pose-Schätzung und Attributanalyse) ist ein langjähriges Problem der Computer Vision. In dieser Arbeit stellen wir einen einheitlichen und vielseitigen Rahmen (HQNet) für die einstufige Mehrpersonen-Mehraufgaben-menschenzentrierte Wahrnehmung (HCP) vor. Unser Ansatz konzentriert sich auf das Lernen einer einheitlichen menschlichen Abfragerepräsentation, bezeichnet als Human Query, die fein differenzierte Instanz-Level-Features für einzelne Personen erfasst und komplexe Mehrpersonenszenarien entwirrt. Obwohl verschiedene HCP-Aufgaben einzeln gut untersucht wurden, wurde das einstufige Mehraufgabenlernen von HCP-Aufgaben aufgrund des Mangels an umfassenden Benchmark-Datensätzen in der Literatur bisher nicht vollständig ausgeschöpft. Um diese Lücke zu schließen, schlagen wir den COCO-UniHuman-Benchmark vor, um die Modellentwicklung und eine umfassende Bewertung zu ermöglichen.Experimentelle Ergebnisse zeigen die Stand-of-the-Art-Leistung der vorgeschlagenen Methode unter Mehraufgaben-HCP-Modellen sowie ihre wettbewerbsfähige Leistung im Vergleich zu aufgabenspezifischen HCP-Modellen. Darüber hinaus betonen unsere Experimente die Anpassungsfähigkeit von Human Query an neue HCP-Aufgaben, was seine robuste Generalisierungsfähigkeit demonstriert. Die Codes und Daten sind unter https://github.com/lishuhuai527/COCO-UniHuman verfügbar.

Sie lernen nur eine Abfrage: Das Lernen einer einheitlichen menschlichen Abfrage für die einstufige Mehrpersonen-Mehraufgaben-Wahrnehmung | Neueste Forschungsarbeiten | HyperAI