PoseTrack: Eine Benchmarksuite für die Schätzung und Verfolgung der menschlichen Haltung

Menschliche Körperhaltungen und -bewegungen sind wichtige Hinweise für die Analyse von Videos mit Menschen, und es gibt starke Beweise dafür, dass Darstellungen auf der Grundlage von Körperformen für eine Vielzahl von Aufgaben wie Aktivitätserkennung, Inhaltsabruf und soziale Signalverarbeitung hoch effektiv sind. In dieser Arbeit streben wir an, den Stand der Technik weiter zu verbessern, indem wir „PoseTrack“ etablieren, einen neuen groß angelegten Benchmark für videobasierte Schätzungen menschlicher Körperhaltungen und artikulierte Verfolgung, und die Gemeinschaft der Forscher, die sich mit der visuellen Analyse des Menschen beschäftigen, zusammenbringen. Der Benchmark umfasst drei Wettbewerbskategorien, die sich auf i) die Schätzung mehrerer Personenhaltungen in Einzelbildern, ii) die Schätzung mehrerer Personenhaltungen in Videos und iii) die artikulierte Verfolgung mehrerer Personen konzentrieren. Um den Benchmark und den Wettbewerb zu erleichtern, sammeln, annotieren und veröffentlichen wir ein neues großes Benchmark-Datensatz (large-scale benchmark dataset), das Videos mit mehreren Personen enthält, die durch Personenspuren und artikulierte Körperhaltungen gekennzeichnet sind. Es wird ein zentraler Evaluierungsserver bereitgestellt, um den Teilnehmern eine Bewertung am abgetrennten Testset zu ermöglichen. Wir sehen vor, dass der vorgeschlagene Benchmark produktive Forschung anregen wird, sowohl durch Bereitstellung eines großen und repräsentativen Trainingsdatensatzes als auch durch Erstellung einer Plattform zur objektiven Bewertung und Vergleich der vorgeschlagenen Methoden. Der Benchmark ist frei zugänglich unter https://posetrack.net.