HyperAIHyperAI

Command Palette

Search for a command to run...

عرض القصة المتماسكة الحافظة للشخصيات

Hong-Han Shuai Huiao-Han Lu Hung-Jen Chen Zhi Rui Tam Yun-Zhu Song

الملخص

تهدف التصور القصصي إلى إنتاج تسلسل من الصور لسرد كل جملة في قصة مكونة من جمل متعددة. على عكس توليد الفيديو الذي يركز على الحفاظ على الاستمرارية بين الصور المولدة (الإطارات)، يُركّز التصور القصصي على الحفاظ على الاتساق العام للشخصيات والمشاهد عبر الصور المختلفة المتعلقة بالقصة، وهو أمر صعب جدًا نظرًا لأن الجمل القصصية توفر فقط إشارات متباعدة لعملية توليد الصور. ولذلك، نقترح إطارًا جديدًا يُسمى "التصور القصصي المتماسك المُحافظ على الشخصية" (CP-CSV) لمعالجة هذه التحديات. يتميّز CP-CSV بتعلّمه الفعّال لتصور القصة من خلال ثلاث وحدات حاسمة: مشفر القصة والسياق (لتعلم تمثيل القصة والجمل)، وتقسيم الخلفية والشكل (مهمة مساعدة لتوفير معلومات تُسهم في الحفاظ على اتساق الشخصية والقصة)، وعملية التوليد المُدركة للشكل والخلفية (توليد تسلسل الصور من خلال دمج معلومات الشكل والخلفية). علاوةً على ذلك، نقترح مقياسًا يُسمى "المسافة القصصية فريشيه" (FSD) لتقييم أداء التصور القصصي. تُظهر التجارب الواسعة أن CP-CSV يحافظ على تفاصيل معلومات الشخصية ويحقق اتساقًا عاليًا بين الإطارات المختلفة، في حين أن FSD يقيّم أداء التصور القصصي بشكل أفضل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp