تحرير قائم على العقد لإنشاء متعدد الوسائط للنص والصوت والصورة والفيديو
Alexander Htet Kyaw Lenin Ravindranath Sivalingam

الملخص
نقدّم نظامًا قائمًا على العقد لسرد القصص في إنشاء المحتوى متعدد الوسائط. يُمثّل النظام القصص كرسوم بيانية مكوّنة من عقد، يمكن توسيعها وتحريرها وتحسينها بشكل تكراري من خلال تعديلات مباشرة من المستخدم وتعليمات بلغة طبيعية. يمكن لكل عقدة دمج النصوص، والصور، والصوت، والفيديوهات، مما يمكّن المبدعين من إنشاء قصص متعددة الوسائط. ويقوم وكيل اختيار المهام بتوجيه العمليات بين مهام توليد متخصصة تُعنى بإنشاء القصص، واستنتاج هيكل العقد، وتنسيق تخطيط العقد، وإنشاء السياق. ويُتيح واجهة المستخدم تحريرًا دقيقًا للعقد الفردية، وفرعًا تلقائيًا لخطوط القصة المتوازية، وتحسينًا تكراريًا قائماً على العقد. تُظهر نتائجنا أن التحرير القائم على العقد يدعم التحكم في هيكل القصة، ويُمكّن من توليد تكراري للنصوص، والصور، والصوت، والفيديوهات. ونُقدّم نتائج كمية حول توليد مخططات تفصيلية تلقائية للقصص، بالإضافة إلى ملاحظات نوعية حول سير عمل التحرير. وأخيرًا، نناقش القيود الحالية مثل قابلية التوسع إلى القصص الطويلة والاتساق عبر عدة عقد، ونُبرز الخطوات المستقبلية نحو أدوات ذكاء اصطناعي إبداعية قائمة على التفاعل البشري ومركزية المستخدم.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.