مُصَوِّر الشبكة العصبية ثلاثي الأبعاد

لنمذجة العالم ثلاثي الأبعاد خلف الصور ثنائية الأبعاد، أي تمثيل ثلاثي الأبعاد هو الأكثر ملاءمة؟ الشبكة متعددة الزوايا (Polygon Mesh) هي مرشح واعد بفضل كفاءتها الهندسية ومظهرها المضغوط. ومع ذلك، فإن نمذجة الشبكة متعددة الزوايا من الصور ثنائية الأبعاد باستخدام الشبكات العصبية ليست عملية مباشرة، حيث أن تحويل الشبكة إلى صورة، أو التظليل (Rendering)، يتضمن عملية غير مستمرة تُعرف بالرسم البكسلي (Rasterization)، مما يمنع الانتشار العكسي (Back-Propagation). لذلك، في هذا البحث، نقترح تدرجًا تقريبيًا للرسم البكسلي يمكن من دمج التظليل في الشبكات العصبية. باستخدام هذا المحرك للتظليل، نقوم بإعادة بناء شبكات ثلاثية الأبعاد من صورة واحدة تحت إشراف صورة السيلو엣 (Silhouette Image)، ونجد أن نظامنا يتفوق على النهج القائم على الفوكسلات (Voxel-Based Approach) الموجود حاليًا. بالإضافة إلى ذلك، نقوم لأول مرة بعمليات تحرير شبكات ثلاثية الأبعاد تعتمد على التدرجات، مثل نقل الأسلوب من二维到三维 (2D-to-3D Style Transfer) 和三维深度梦 (3D DeepDream),在二维监督下进行。这些应用展示了将网格渲染器集成到神经网络中的潜力以及我们提出的渲染器的有效性。请注意,最后一句中有一部分是用中文写的,以下是修正后的翻译:بالإضافة إلى ذلك، نقوم لأول مرة بعمليات تحرير شبكات ثلاثية الأبعاد تعتمد على التدرجات، مثل نقل الأسلوب من الصور ثنائية الأبعاد إلى ثلاثية الأبعاد (2D-to-3D Style Transfer) والعمق العميق ثلاثي الأبعاد (3D DeepDream)، تحت إشراف ثنائي الأبعاد. هذه التطبيقات تظهر إمكانات دمج محرك التظليل للشبكة في الشبكات العصبية وكفاءة المحرك المقترح لدينا.