
摘要
在编创舞蹈动作时,编舞者往往因其长期熟悉特定舞蹈风格而形成个人习惯,因而倾向于重复运用自己擅长的舞蹈语汇。倘若能够借助人工智能技术,为编舞者提供跨舞种的创意建议,并推荐与其个人创作风格相契合的舞蹈动作,将极大拓展创作可能性。目前,已有多种面向特定任务的自回归网络被用于舞蹈生成,但现有方法存在一个严重缺陷:在给定初始姿态序列的情况下,所有现有算法均容易生成重复性模式,导致输出质量下降。为解决这一问题,本文提出MNET——一种新颖且可扩展的方法,仅需单一模型即可实现基于音乐条件的多风格舞蹈生成,能够融合多种舞蹈流派的特征。具体而言,我们通过训练一种基于Transformer架构的条件生成对抗网络(Conditional GAN),学习具备舞种感知能力的潜在表示。我们在AIST++数据集上开展了大量实验,并结合用户调研验证了方法的有效性。实验结果表明,相较于当前最优方法,MNET能够生成在语义合理性与多样性方面均表现优异的舞蹈序列,且在定性与定量评估中均展现出显著优势。