AniMaker: السرد المتحرك الآلي متعدد الوكلاء مع إنشاء مقاطع بواسطة MCTS

رغم التقدم السريع في نماذج توليد الفيديو، فإن إنتاج مقاطع فيديو سردية متماسكة تغطي عدة مشاهد وأبطال لا يزال تحديًا. الطرق الحالية غالبًا ما تقوم بتحويل الإطارات الرئيسية المُعدة مسبقًا إلى مقاطع فيديو ذات طول ثابت، مما يؤدي إلى سرد غير متصل ومشاكل في الوتيرة. بالإضافة إلى ذلك، فإن عدم الاستقرار الذاتي لنماذج توليد الفيديو يعني أن حتى مقطع فيديو منخفض الجودة واحد يمكن أن يقلل بشكل كبير من تماسك القصة المنطقية واستمرارية الصورة للرسوم المتحركة النهائية. لتجاوز هذه العقبات، نقدم AniMaker (أنيمكر)، وهو إطار عمل متعدد الوكلاء يتيح توليد مقاطع متعددة بكفاءة واختيار مقاطع واعٍ بالسرد، مما يساهم في إنشاء رسوم متحركة عالمية التماسك ومتماسكة القصة بناءً على المدخلات النصية فقط. يتم تنظيم الإطار حول وكلاء متخصصين، بما في ذلك وكيل المخرج لإنشاء اللوحات القصصية، وكيل التصوير لإنتاج مقاطع الفيديو، وكيل المراجعة لتقييم الجودة، ووكيل ما بعد الإنتاج لتحرير وإضافة الصوت.في صميم نهج أنيمكر تقنيتان رئيسيتان: MCTS-Gen (إم سي تي أس-جين) في وكيل التصوير، وهي استراتيجية مستوحاة من البحث الشجري مونتي كارلو (Monte Carlo Tree Search - MCTS) بكفاءة عالية تقوم بتوجيه ذكي للمجال المرشح لتوليد مقاطع ذات إمكانات عالية مع تعظيم استخدام الموارد؛ وAniEval (أنيإيفال) في وكيل المراجعة، وهو أول إطار عمل مصمم خصيصًا لتقييم الرسوم المتحركة المتعددة المشاهد، حيث يقوم بتقييم جوانب حيوية مثل تماسك القصة على المستوى الكلي، إكمال الأفعال، والميزات الخاصة بالرسوم المتحركة من خلال النظر إلى كل مقطع في سياق المقاطع السابقة واللاحقة له. تظهر التجارب أن أنيمكر يحقق جودة فائقة حسب المقاييس الشائعة مثل VBench (في بينتش) والإطار الذي اقترحناه أنيإيفال، بينما يحسن بشكل كبير كفاءة توليد المرشحين المتعددين ويقرب الرسوم المتحركة السردية التي تم إنتاجها باستخدام الذكاء الاصطناعي من المعايير الإنتاجية.