التصعيد اللوني للصور مع الوعي بالمثيلات

تلوين الصور هو مشكلة متأصلة فيها عدم تحديد واضح وتشابك متعدد الأوضاع. الطرق السابقة استخدمت الشبكات العصبية العميقة لربط صور الدخال الرمادية بنتائج تلوين محتملة مباشرة. رغم أن هذه الطرق القائمة على التعلم أظهرت أداءً مثيرًا للإعجاب، إلا أنها غالبًا ما تفشل في صور الدخال التي تحتوي على عدة أجسام. السبب الرئيسي لهذا الفشل هو أن النماذج الحالية تقوم بالتعلم والتلوين على الصورة بأكملها. وفي غياب فصل واضح بين الشكل والخلفية، لا تستطيع هذه النماذج تحديد وتعلم معاني مستويات الأجسام بشكل فعال. في هذا البحث، نقترح طريقة لتحقيق تلوين يعي جوانب الكيانات (instance-aware). بنية شبكتنا تستفيد من كاشف الأجسام الجاهز للحصول على صور للأجسام المقصوصة واستخدام شبكة تلوين الكيانات لاستخراج خصائص مستوى الجسم. نستخدم شبكة مشابهة لاستخراج خصائص الصورة الكاملة ونطبق وحدة دمج لدمج خصائص مستوى الجسم والصورة لتنبؤ بالألوان النهائية. يتم تعلم كل من شبكات التلوين وأدوات الدمج من مجموعة بيانات كبيرة الحجم. تظهر نتائج التجارب أن عملنا يتفوق على الطرق الموجودة في مختلف مقاييس الجودة ويحقق أفضل الأداء في مجال تلوين الصور.请注意,为了更符合阿拉伯语的表达习惯,我在翻译时对一些句子进行了适当的结构调整。同时,对于“instance-aware”这一术语,我选择了在括号中标注原文的方式以确保信息的完整性。