FreeMotion: Ein einheitlicher Rahmen für zahlenfreie Text-zu-Bewegung-Synthese

Die Text-zu-Bewegung-Synthese ist eine zentrale Aufgabe im Bereich des Computersehens. Bestehende Methoden sind aufgrund ihrer Spezialisierung auf Einzel- oder Zwei-Personen-Szenarien in ihrer Allgemeingültigkeit eingeschränkt und können nicht zur Generierung von Bewegungen für mehrere Personen eingesetzt werden. Um eine personenanzahlunabhängige Bewegungssynthese zu erreichen, überdenkt dieser Artikel die Bewegungsgenerierung neu und schlägt vor, die Einzel- und Mehrpersonenbewegung durch eine bedingte Bewegungsverteilung zu vereinheitlichen. Zudem werden ein Generationsmodul und ein Interaktionsmodul für unseren FreeMotion-Framework entworfen, um den Prozess der bedingten Bewegungsgenerierung zu entkoppeln und schließlich eine personenanzahlunabhängige Bewegungssynthese zu ermöglichen. Darüber hinaus kann auf Basis unseres Frameworks die aktuelle Methode zur räumlichen Kontrolle von Einzelpersonenbewegungen nahtlos integriert werden, wodurch eine präzise Kontrolle von Mehrpersonenbewegungen erreicht wird. Umfangreiche Experimente belegen die überlegene Leistung unserer Methode sowie unsere Fähigkeit, sowohl Einzel- als auch Mehrpersonenbewegungen gleichzeitig zu inferieren.