AI Playground: Unreal Engine-basiertes Daten-Ablations-Tool für Deep Learning

Maschinelles Lernen erfordert Daten, aber das Erwerben und Kennzeichnen von realen Daten ist herausfordernd, teuer und zeitaufwendig. Noch wichtiger ist, dass es nach der Datenerfassung fast unmöglich ist, reale Daten zu verändern (z.B. die Beleuchtung eines Raums), was es sehr schwierig macht, zu messen, wie bestimmte Eigenschaften der Daten die Leistung beeinflussen. In dieser Arbeit stellen wir den AI Playground (AIP) vor, ein quelloffenes Werkzeug auf Basis des Unreal Engine zur Generierung und Kennzeichnung virtueller Bild-Daten. Mit AIP ist es einfach, das gleiche Bild unter verschiedenen Bedingungen (z.B. Genauigkeit, Beleuchtung usw.) und mit unterschiedlichen Grundwahrheiten (z.B. Tiefenwerte oder Oberflächennormalen) aufzunehmen. AIP ist leicht erweiterbar und kann mit oder ohne Code verwendet werden. Um unser vorgeschlagenes Werkzeug zu validieren, generierten wir acht Datensätze mit ansonsten identischen, aber variierenden Beleuchtungs- und Genauigkeitsbedingungen. Wir trainierten dann tiefe neuronale Netze, um (1) Tiefenwerte, (2) Oberflächennormalen oder (3) Objektlabels zu prognostizieren und bewerteten die intra- und cross-Datensatz-Leistung jedes Netzes. Unter anderem konnten wir bestätigen, dass die Empfindlichkeit gegenüber verschiedenen Einstellungen problemspezifisch ist. Wir verifizierten die Ergebnisse anderer Studien, wonach Segmentierungsmodelle sehr empfindlich gegenüber der Genauigkeit sind, aber auch fanden wir heraus, dass sie genauso empfindlich gegenüber der Beleuchtung sind. Im Gegensatz dazu scheinen Tiefen- und Normalenschätzungsmodelle weniger empfindlich gegenüber der Genauigkeit oder Beleuchtung und mehr gegenüber der Struktur des Bildes zu sein. Schließlich testeten wir unsere trainierten Tiefenschätzungsnetze an zwei realen Datensätzen und erzielten Ergebnisse vergleichbar mit denen des Trainings allein auf realen Daten, was bestätigt, dass unsere virtuellen Umgebungen realistisch genug für Aufgaben in der realen Welt sind.