Command Palette
Search for a command to run...
كاندينسكي 5.0: عائلة من النماذج الأساسية لإنشاء الصور والفيديوهات
كاندينسكي 5.0: عائلة من النماذج الأساسية لإنشاء الصور والفيديوهات
الملخص
يقدم هذا التقرير مجموعة نماذج Kandinsky 5.0، وهي سلسلة من النماذج الأساسية الرائدة في مجال إنشاء الصور عالية الدقة وفيديوهات مدتها 10 ثوانٍ. يتكون الإطار من ثلاث نماذج أساسية: Kandinsky 5.0 Image Lite – وهي سلسلة من نماذج إنشاء الصور ذات 6 مليار معلمة، وKandinsky 5.0 Video Lite – وهي نماذج خفيفة الوزن وسريعة ذات 2 مليار معلمة لتحويل النص إلى فيديو وإنشاء فيديو من صورة، وKandinsky 5.0 Video Pro – وهي نماذج ذات 19 مليار معلمة تحقق جودة فيديو متفوقة. نقدم مراجعة شاملة لدورة تجهيز البيانات – بما في ذلك جمع البيانات، ومعالجتها، وتصفية البيانات، وتوحيد البيانات (التكثيف) – الخاصة بمسار التدريب متعدد المراحل الذي يتضمن تدريبًا مسبقًا واسع النطاق، ويُدمج فيه تقنيات تحسين الجودة مثل التدريب الدقيق الذاتي (SFT) والتدريب اللاحق القائم على التعلم المعزز (RL). كما نقدم تحسينات مبتكرة في البنية المعمارية، وطرق التدريب، وتقنيات الاستنتاج، التي تمكن Kandinsky 5.0 من تحقيق سرعة عالية في الإنشاء وأداءً رائدًا على مستوى العالم في مختلف المهام، كما أثبت ذلك تقييم البشر. وباعتبارها إطارًا توليديًا واسع النطاق ومفتوح المصدر، تستفيد Kandinsky 5.0 بالكامل من إمكانات التدريب المسبق ومرحلتها اللاحقة، مما يجعلها قابلة للتكيف مع طيف واسع من التطبيقات التوليدية. نأمل أن يسهم هذا التقرير، جنبًا إلى جنب مع إصدار كودنا المفتوح ونقاط التدريب، في تقدم كبير وزيادة في إمكانية الوصول إلى نماذج توليدية عالية الجودة للمجتمع البحثي.