EvoPose2D: Die Grenzen der 2D-Menschenpose-Schätzung durch beschleunigte Neuroevolution mit Gewichtstransfer voranbringen

Neural Architecture Search hat sich als äußerst wirksam bei der Gestaltung effizienter konvolutioneller Neuraler Netze erwiesen, die besser für die Mobile-Deployment-Optimierung geeignet sind als handgebaute Netzwerke. Ausgehend von der Hypothese, dass Neural Architecture Search großes Potenzial für die menschliche Pose-Schätzung besitzt, untersuchen wir erstmals die Anwendung von Neuroevolution – einer Form des Neural Architecture Search, die von der biologischen Evolution inspiriert ist – zur Gestaltung von 2D-Pose-Netzwerken. Zusätzlich schlagen wir eine neue Gewichtstransfer-Strategie vor, die es uns ermöglicht, die Neuroevolution flexibel zu beschleunigen. Unser Ansatz erzeugt Netzwerke, die sowohl effizienter als auch genauer sind als aktuelle state-of-the-art handgebaute Netzwerke. Tatsächlich verarbeiten die generierten Netzwerke Bilder mit höherer Auflösung, während sie weniger Berechnungsaufwand benötigen als frühere handgebaute Netzwerke bei niedrigerer Auflösung, wodurch wir die Grenzen der 2D-Pose-Schätzung erweitern können. Unser Basisnetzwerk, das mittels Neuroevolution entworfen wurde und als EvoPose2D-S bezeichnet wird, erreicht eine vergleichbare Genauigkeit wie SimpleBaseline, ist jedoch 50 % schneller und weist eine Dateigröße von 12,7x kleiner auf. Unser größtes Netzwerk, EvoPose2D-L, erreicht eine neue state-of-the-art Genauigkeit auf dem Microsoft COCO Keypoints Benchmark, ist 4,3x kleiner als sein nächster Konkurrent und verfügt über eine vergleichbare Inferenzgeschwindigkeit. Der Quellcode ist öffentlich verfügbar unter https://github.com/wmcnally/evopose2d.