HyperAIHyperAI
vor 11 Tagen

Lodge: Eine Grob-zu-Fein-Diffusionsnetzwerk für die Langzeit-Tanzgenerierung, geleitet durch charakteristische Tanzprimitiven

Ronghui Li, YuXiang Zhang, Yachao Zhang, Hongwen Zhang, Jie Guo, Yan Zhang, Yebin Liu, Xiu Li
Lodge: Eine Grob-zu-Fein-Diffusionsnetzwerk für die Langzeit-Tanzgenerierung, geleitet durch charakteristische Tanzprimitiven
Abstract

Wir stellen Lodge vor, ein Netzwerk, das in der Lage ist, extrem lange Tanzsequenzen bedingt auf gegebene Musik zu generieren. Wir entwerfen Lodge als zweistufige, grob-zu-fein ausgerichtete Diffusionsarchitektur und führen charakteristische Tanzprimitive ein, die erhebliche Ausdruckskraft besitzen und als Zwischenrepräsentationen zwischen zwei Diffusionsmodellen dienen. Die erste Stufe ist die globale Diffusion, die sich auf die Erfassung der groben Musik-Tanz-Beziehung und die Erzeugung charakteristischer Tanzprimitive konzentriert. Im Gegensatz dazu handelt es sich bei der zweiten Stufe um die lokale Diffusion, die detaillierte Bewegungssequenzen parallel unter Anleitung der Tanzprimitive und choreografischer Regeln generiert. Zudem stellen wir einen Foot Refine Block vor, der die Kontaktaufnahme zwischen Füßen und Boden optimiert und somit die physikalische Realitätsnähe der Bewegung verbessert. Unser Ansatz ermöglicht die parallele Generierung von Tanzsequenzen extremer Länge und erreicht ein ausgewogenes Verhältnis zwischen globalen Choreografie-Mustern und lokaler Bewegungsqualität sowie Ausdruckskraft. Umfangreiche Experimente bestätigen die Wirksamkeit unseres Verfahrens.

Lodge: Eine Grob-zu-Fein-Diffusionsnetzwerk für die Langzeit-Tanzgenerierung, geleitet durch charakteristische Tanzprimitiven | Neueste Forschungsarbeiten | HyperAI