أداة NVIDIA الجديدة تتيح تحرير الدقة لمشاهد ثلاثية الأبعاد ومعالجة الصور الفوتوغرافية بطريقة محددة
NVIDIA تطلق أداة AI جديدة لتحرير المشاهد ثلاثية الأبعاد والصور الفوتوغرافية في السنوات الأخيرة، قدم العلماء الحاسوبيون نماذج ذكاء اصطناعي متقدمة يمكنها إنتاج محتوى شخصي بناءً على مدخلات أو تعليمات محددة. رغم ذلك، تظل معظم هذه النماذج غير متوقعة، وضبط الصور التي تنتجها يبقى تحديًا. في بحث تم تقديمه في مؤتمر رؤية الحاسوب وتعرف الأنماط (CVPR 2025)، الذي عُقد في ناشفيل من 11 إلى 15 يونيو 2025، قدم باحثو NVIDIA تقنية جديدة تسمى DiffusionRenderer. هذه التقنية تعتمد على نهج تعلم الآلة وتهدف إلى تحسين إنشاء وتحرير الصور، مما يتيح للمستخدمين ضبط خصائص الصور بدقة عالية. قالت سانجا فيدلر، نائبة الرئيس لبحوث الذكاء الاصطناعي في NVIDIA ورئيسة مختبر الذكاء المكاني: "حققت التقنيات المولدة للذكاء الاصطناعي تقدمًا كبيرًا في إنشاء محتوى بصري، لكنها أدخلت سير عمل إبداعي جديد يختلف عن الرسومات الكلاسيكية وما زالت تواجه تحديات في القابلية للتحكم. كان هدفنا مع DiffusionRenderer هو جسر هذه الفجوة من خلال الجمع بين دقة خطوط الإنتاج التقليدية للرسومات ومرونة الذكاء الاصطناعي. نهدف إلى تصميم الجيل القادم من الرسومات لتكون أكثر سهولة في الوصول إليها، قابلة للتحكم، وسهولة التكامل مع الأدوات الموجودة." آلية عمل DiffusionRenderer تعمل تقنية DiffusionRenderer على تحويل مقاطع الفيديو ثنائية الأبعاد (2D) إلى تمثيلات مشاهد تتوافق مع الرسومات. كما أنها تسمح للمستخدمين بتعديل الإضاءة والمواد في هذه التمثيلات، مما يؤدي إلى إنتاج محتوى جديد يتناسب مع احتياجاتهم وتفضيلاتهم. أضافت فيدلر: "تعتبر DiffusionRenderer تطورًا كبيرًا لأنها تحل مشكلتين طويلتين الأمد في الرسومات الحاسوبية في آن واحد – التصوير العكسي لاستخراج الهندسة والمواد من مقاطع الفيديو الحقيقية، والتصوير التقدمي لإنشاء صور ومقاطع فيديو فوتوغرافية من تمثيلات المشاهد." تقنية الانتشار (Diffusion) تستند التقنية الجديدة إلى نماذج الانتشار، وهي فئة من خوارزميات التعلم العميق التي تولد الصور عبر تكرار تحسين الضوضاء العشوائية حتى تصبح رسومات متماسكة. على عكس التقنيات الأخرى لإنشاء الصور التي تم تقديمها سابقًا، يعمل DiffusionRenderer أولاً على إنتاج G-buffers، وهي تمثيلات وسطية للصور تحدد خصائص معينة، ثم يستخدم هذه التمثيلات لإنشاء صور جديدة وواقعية. قالت فيدلر: "نحن فخورون أيضًا بالتطور الكبير الذي حققناه في بناء مجموعة بيانات مصنوعة بدقة تحتوي على إضاءة ومواد دقيقة لمساعدة النموذج على التعلم لتفكيك وإعادة تركيب المشاهد بشكل واقعي. وجدنا أن جودة النتائج تتحسن مع حجم النموذج الأساسي لفيديو الانتشار، مما يعني أن نتائجنا أصبحت أكثر حدة واتساقًا عندما تم دمجها مع NVIDIA Cosmos." التطبيقات المستقبلية يمكن لتقنية DiffusionRenderer أن تكون مفيدة لعلماء الروبوتات والمحترفين الإبداعيين على حد سواء. على سبيل المثال، يمكن أن يستفيد مصممو ألعاب الفيديو والإعلانات ومعدو الأفلام من هذه التقنية لإضافة أو إزالة أو تعديل خصائص معينة بدقة عالية. كما يمكن استخدامها من قبل علماء الحاسوب لإنشاء بيانات فوتوغرافية واقعية لتدريب الخوارزميات في مجالات مثل الروبوتات وتعرف الصور. أضافت فيدلر: "أثرها الآخر الهائل قد يكون في مجال المحاكاة والذكاء الاصطناعي الفيزيائي — يحتاج تدريب الروبوتات والمركبات ذاتية القيادة إلى مجموعات بيانات متنوعة قدر الإمكان، وDiffusionRenderer يمكنها إنتاج ظروف إضاءة جديدة من مشاهد جديدة. نحن متحمسون لمواصلة دفع الحدود في هذا المجال." خطط المستقبل تركز الخطط المستقبلية لفريق البحث في NVIDIA على تحسين جودة النتائج، زيادة كفاءة التشغيل، وإضافة ميزات أكثر قوة مثل التحكم الدلالي، تركيب الكائنات، وأدوات تحرير متقدمة. تقييم الخبراء يعتبر الخبراء في مجالي الرسومات الحاسوبية والذكاء الاصطناعي أن DiffusionRenderer يمثل تطورًا كبيرًا في مجال إنشاء وتحرير الصور. فهي تجمع بين الدقة والمرونة بطريقة لم تكن ممكنة سابقًا، مما قد يفتح الباب أمام تطبيقات جديدة ومبتكرة في صناعة المحتوى البصري وفي مجالات البحث العلمي. نبذة عن NVIDIA NVIDIA هي شركة رائدة في مجال تقنيات الرسومات الحاسوبية والذكاء الاصطناعي. تأسست في عام 1993، وتعتبر واحدة من أكبر الشركات في العالم في مجال تقنيات معالجة الرسومات والحوسبة المتسارعة. تمتلك NVIDIA محفظة واسعة من المنتجات والتقنيات، بما في ذلك بطاقات الرسومات، الشبكات، وأجهزة الحوسبة الخاصة بالسيارات والروبوتات.