Command Palette
Search for a command to run...

الملخص
تتفوّق نماذج النص إلى الفيديو من الجيل الأحدث في إنشاء مشاهد منفصلة، لكنها تفشل في إنتاج قصص متسلسلة متماسكة تتكون من مشاهد متعددة، وهي الصفة الجوهرية للسرد القصصي. نحن نُغَطِّي هذا "الفراغ السردي" من خلال نموذج "هولو سيني" (HoloCine)، الذي يُولِّد المشاهد بأكملها بشكل شمولي، لضمان الاتساق العالمي من أول لقطة إلى الأخيرة. تُحقِّق بنية النموذج تحكمًا دقيقًا في الإخراج من خلال آلية "الانتباه المتقاطع النافذة" (Window Cross-Attention)، التي تُركِّز أوامر النص على لقطات محددة، في حين يضمن نمط "الانتباه الذاتي النادر بين اللقطات" (كثيف داخل اللقطات، ونادر بينها) الكفاءة المطلوبة لإنشاء محتوى يمتد لدقائق. إلى جانب تحقيق حالة متقدمة جديدة في الاتساق السردي، يُظهر "هولو سيني" قدرات مُستَمَّة مُبهرة، منها ذاكرة مستمرة للشخصيات والمشاهد، وفهمًا طبيعيًا للتقنيات السينمائية. تمثل هذه الدراسة تحولًا جوهريًا من توليد المشاهد المنفصلة نحو إنتاج أفلام تلقائي، مما يجعل إنشاء السينما من البداية إلى النهاية حلمًا واقعيًا في المستقبل القريب. يمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://holo-cine.github.io/.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.