
アニメーションの彩色は、実際のアニメーション産業における重要な部分です。長編アニメーションの彩色には高い労働コストがかかります。そのため、ビデオ生成モデルに基づく自動的な長編アニメーションの彩色に関する研究は大きな価値があります。既存の研究は短期間の彩色に限定されています。これらの研究では、局所的なパラダイムが採用され、重複する特徴を融合して局所セグメント間の滑らかな移行を達成しています。しかし、局所的なパラダイムは全体的な情報を無視しており、長期的な色彩の一貫性を維持できていません。本研究では、理想的な長期的な色彩の一貫性は動的全体-局所パラダイムを通じて達成できると主張します。つまり、現在の生成に関連する全体的に一貫した色彩特徴を動的に抽出することです。具体的には、LongAnimationという新しいフレームワークを提案します。このフレームワークは主にSketchDiT(スケッチディティ)、動的全体-局所メモリ(Dynamic Global-Local Memory: DGLM)、および色彩一貫性報酬(Color Consistency Reward)で構成されています。SketchDiTはハイブリッド参照特徴を捉え、DGLMモジュールをサポートします。DGLMモジュールでは、長いビデオ理解モデルを使用して全体的な歴史的特徴を動的に圧縮し、現在の生成特徴と適応的に融合させます。色彩の一貫性を精緻化するために、色彩一貫性報酬を導入しました。推論時には、ビデオセグメント間の移行を滑らかにするために色彩一貫性融合手法を提案しています。短編(14フレーム)および長編(平均500フレーム)アニメーションに対する広範囲な実験結果から、LongAnimationがオープンドメインのアニメーション彩色タスクにおいて短期間と長期間にわたる色彩の一貫性を維持する有効性が示されました。コードは以下のURLから入手できます:https://cn-makers.github.io/long_animation_web/。