السياق القصصي: سرد بصري متسق مع تحسين المكان وسياق القصة

يتعلق السرد البصري بإنشاء سلسلة من الإطارات المتماسكة من قصة نصية مع الحفاظ على التوافق في الشخصيات والمشاهد. تعاني الطرق الذاتية الانحدارية الحالية، التي تعتمد على أزواج الإطار-الجملة السابقة، من استهلاك ذاكرة عالي، وسرعات توليد بطيئة، وتكامل سياق محدود. لمعالجة هذه القضايا، نقترح إطارًا جديدًا يُسمى ContextualStory مصممًا لإنشاء إطارات قصة متماسكة وتوسيع الإطارات للسرد البصري. يستخدم ContextualStory انتباهًا زمنيًا مُعززًاatially-Enhanced Temporal Attention) لالتقاط الارتباطات المكانية والزمنية، مما يتعامل بكفاءة مع حركات الشخصيات الكبيرة. بالإضافة إلى ذلك، نقدم Storyline Contextualizer لتثري السياق في تمثيل القصة، و StoryFlow Adapter لقياس التغيرات المشهدية بين الإطارات بهدف توجيه النموذج. تُظهر التجارب الواسعة على قواعد بيانات PororoSV وFlintstonesSV أن ContextualStory يتفوق بشكل كبير على الأساليب الرائدة حاليًا (SOTA) في كل من تصور القصة واستمرارها. يمكن الحصول على الكود من الرابط: https://github.com/sixiaozheng/ContextualStory.