HyperAIHyperAI
منذ 2 أشهر

iColoriT: نحو نشر التلميح المحلي إلى المنطقة الصحيحة في التلوين التفاعلي باستخدام محول الرؤية

Jooyeol Yun; Sanghyeon Lee; Minho Park; Jaegul Choo
iColoriT: نحو نشر التلميح المحلي إلى المنطقة الصحيحة في التلوين التفاعلي باستخدام محول الرؤية
الملخص

التصعيد التفاعلي بالنقاط للصور يهدف إلى تلوين الصور الرمادية عندما يوفر المستخدم الألوان لمواقع محددة. من الضروري أن تقوم طرق التصعيد التفاعلي بالنقاط بنشر الألوان المقدمة من قبل المستخدم (أي، تلميحات المستخدم) في جميع أنحاء الصورة للحصول على صورة ملونة بشكل معقول بجهد مستخدم أدنى. ومع ذلك، غالباً ما تنتج النهج الحالية نتائج جزئية ملونة بسبب تصميم غير فعال لطيات التجميع لتوزيع التلميحات إلى المناطق البعيدة ذات الصلة. لحل هذه المشكلة، نقدم iColoriT، وهو محول رؤية جديد للتصعيد التفاعلي بالنقاط قادر على نشر تلميحات المستخدم إلى المناطق ذات الصلة، مستفيداً من المجال الاستقبالي العالمي للمحولات (Transformers). يتيح آلية الانتباه الذاتي للمحولات لـ iColoriT اختيار تلوين المناطق ذات الصلة باستخدام عدد قليل فقط من التلميحات المحلية. يستخدم نهجنا تقنية الشفرة البكسلية بكفاءة لإعادة حجم الصورة بدلاً من هيكل الكودر (decoder)، مما يمكنه من تلوين الصور في الوقت الفعلي. كما ونقدم طبقة الاستقرار المحلية لتعويض الآثار الجانبية التي قد تتسبب فيها الشفرة البكسلية عند استخدام نسب إعادة الحجم الكبيرة. تظهر النتائج الكمية والنوعية الواسعة أن نهجنا يتفوق بشكل كبير على الأساليب الحالية للتصعيد التفاعلي بالنقاط، بإنتاج صور ملونة بدقة وبجهد مستخدم أدنى. يمكن الوصول إلى الأكواد الرسمية عبر الرابط: https://pmh9960.github.io/research/iColoriT

iColoriT: نحو نشر التلميح المحلي إلى المنطقة الصحيحة في التلوين التفاعلي باستخدام محول الرؤية | أحدث الأوراق البحثية | HyperAI