Social GAN: Sozial akzeptable Trajektorien mit Generativen Widersprüchlichen Netzen

Das Verständnis menschlichen Bewegungsverhaltens ist entscheidend für autonome bewegliche Plattformen (wie selbstfahrende Autos und soziale Roboter), wenn diese in menschenzentrierten Umgebungen navigieren sollen. Dies stellt eine Herausforderung dar, da das menschliche Bewegungsverhalten von Natur aus multimodal ist: gegeben einer Historie von Bewegungspfaden, gibt es viele sozial plausiblen Möglichkeiten, wie Menschen sich in der Zukunft bewegen könnten. Wir lösen dieses Problem, indem wir Werkzeuge aus der Sequenzvorhersage und generativen adversären Netzen kombinieren: ein rekurrentes Sequenz-zu-Sequenz-Modell beobachtet Bewegungshistorien und prognostiziert zukünftiges Verhalten, wobei es einen neuen Pooling-Mechanismus verwendet, um Informationen über mehrere Personen zu aggregieren. Wir trainieren unser Modell adversarisch gegen einen rekurrenten Diskriminator, um sozial plausible Zukünfte vorherzusagen, und fördern vielfältige Vorhersagen durch den Einsatz eines neuartigen Vielfaltverlusts (variety loss). Durch Experimente mit mehreren Datensätzen zeigen wir, dass unser Ansatz in Bezug auf Genauigkeit, Vielfalt, Kollisionsvermeidung und Rechenkomplexität die bisherige Arbeit übertrifft.