Multiple-Human-Parsing im Freien

Die menschliche Bildanalyse (human parsing) gewinnt zunehmend an Forschungsinteresse. In dieser Arbeit streben wir an, die Grenzen der menschlichen Bildanalyse weiter zu erweitern, indem wir das Problem der Mehrpersonen-Bildanalyse in natürlichen Szenarien (multi-human parsing in the wild) einführen. Bestehende Arbeiten zur menschlichen Bildanalyse konzentrieren sich hauptsächlich auf Einzelpersonenszenarien, was von den realen Anwendungen abweicht, in denen mehrere Personen gleichzeitig mit Interaktion und Verdeckung auftreten. Um das Problem der Mehrpersonen-Bildanalyse anzugehen, stellen wir einen neuen Mehrpersonen-Bildanalyse-Datensatz (MHP-Datensatz) und ein neues Modell für Mehrpersonen-Bildanalyse vor, das MH-Parser genannt wird. Der MHP-Datensatz enthält mehrere Personen, die in realen Szenen aufgenommen wurden, mit pixelgenauen semantischen Annotationen in einem instanzbasierten Kontext. Der MH-Parser generiert globale Analysekarten und Masken für Personinstanzen gleichzeitig in einem bottom-up Ansatz unter Verwendung eines neuen Graph-GAN-Modells. Wir sehen vor, dass der MHP-Datensatz als wertvolle Datenressource dienen wird, um neue Modelle für Mehrpersonen-Bildanalyse zu entwickeln, und dass der MH-Parser eine starke Baseline bietet, um zukünftige Forschungen zur Mehrpersonen-Bildanalyse in natürlichen Szenarien voranzutreiben.